什么是量化(量化交易和投资说明)

seoxin 08-07 14:56 114次浏览

内容摘要:在大数据时代,量化方法的用处越来越大。基于清代官吏惩治和历史时期政治稳定性的研究,本文讨论了量化历史研究对历史政治学的潜在价值,包括提供高质量的数据,检验、完善政治科学理论,促进跨国和跨地区的有效比较等。

关键词:量化历史;历史政治学;历史大数据

文献来源:《中国政治学》2021年第1辑,第54-60页。

作者简介:林展,中国人民大学清史研究所讲师。

我报告的主题是“量化历史与历史政治学”。我主要从事中国经济史和量化历史的研究,对历史政治学还缺乏了解,但我和合作者目前所做的一些研究工作,或许跟历史政治学有一定的关联,所以很高兴借此机会做一个分享。我想不同学科学者的交流,有利于打破学科的壁垒,激发新的灵感,促进对一些重要问题的深入讨论,也会有助于新知识的生产。这也是促使我来参加此次会议的原因。接下来首先简要讨论量化历史与历史政治学的关系,然后通过两个具体的研究案例,说明量化历史研究对历史政治学的潜在价值。

图1展示了量化历史作为一个交叉学科的特征以及与历史政治学的关系。总的来说,量化历史是一个跨学科或者说交叉学科的研究领域,大体上涉及历史学、社会科学理论(包括政治学、经济学、社会学、人类学等)以及量化分析方法三大领域。在这三大领域交叉的部分就是量化历史。历史政治学可能是社会科学理论里政治学跟历史学之间重叠的部分。有些历史政治学研究主要使用定性方法,但越来越多的研究用到量化方法,就像王裕华教授介绍的他的研究(中国国家的兴衰:从盛唐到晚清)。这样,历史政治学跟量化历史之间就有了交集,或者说可以有一些对话的地方。

量化历史与历史政治学

用量化方法来研究历史,主要从经济史开始,大致起源于1957年,后来在道格拉斯·诺斯(Douglass North)和罗伯特·福格尔(Robert Fogel)的研究启发下,量化经济史的研究方法很快得到推广,但由于计算机技术和相关的历史数据库没有随之进步,这一研究取向在兴盛一时之后没有持续。近年来,随着历史大数据时代的到来,新的统计方法和计算机技术快速发展、大规模历史数据涌现,量化历史研究又再次复兴。

从2013年开始,量化历史在国内快速发展,时在耶鲁大学、目前在香港大学的陈志武教授,清华大学的龙登高教授,时在伦敦经济学院、目前在日本一桥大学的马德斌教授共同发起量化历史讲习班以及量化历史研究国际年会。在已经举办的七届讲习班中,有180多所海内外高校的800多个学员参加了学习,大部分是博士研究生和青年教师,40%的学员是历史学背景,50%是政治学、经济学以及社会学这些社会科学背景,还有10%的学员是其他的学科背景。由此,可以看到量化历史研究已经在历史学、政治学以及其他社会科学之间产生了比较广泛的对话。此外,量化历史研究团队也出版了《量化历史研究》辑刊,迄今已经出版了5辑,并且创办了“量化历史研究”微信公众号,有约8万个关注者。

以上是量化历史研究在国内的发展状况,接下来简要介绍两个研究案例。分别是关于清代官吏惩治和历史上政治稳定性的研究。清代官吏惩治的研究是我和香港大学陈志武教授、张晓鸣博士一起合作的,限于篇幅,这里只介绍一些基本的研究方法和基本发现。我们的研究,从费正清的观察出发,他发现“中华帝国有一个不可思议的地方,就是它能用一个很小的官员编制来统治如此众多的人口”。这是历史学或者其他对历史感兴趣的社会科学学者都很熟悉的一个论断。皇帝住在北京的紫禁城,但是要统治那么广的疆域,首先就要面临一个委托代理问题,即怎么样让下面的官员能够按照皇帝的意志去进行治理。另外就是地方与地方之间的差别很大,即使皇帝或中央政府掌握足够的信息,当他要推动一些政策的时候,也很难根据每一个地方的特点去采取相应不同的政策。已有研究指出,为了应对这些挑战,清代建立了4个基础性的制度安排,包括官僚制、科举制、乡绅自治和“一国多制”。“一国多制”是指,在清代,内地18省和新疆、西藏以及蒙古等这些边疆地区,实行的制度有很大差别。我们的研究重点是这4个基础制度里面的官僚制。更具体地说,是研究统治者如何通过“胡萝卜加大棒”的方式,保证这些官员有足够的激励,在委托—代理的挑战下能够更好地达到统治者希望达到的目标。这里的激励方式可以分为正向激励和负向激励,比如“胡萝卜”就是正向激励,“大棒”就是负向激励。我们重点关注“大棒”这一类,就是对官员的处分,我们关心的是这种处分对于官员行为的影响。最后想回答统治者是如何对官员进行动态激励这样一个问题,用到的主要资料来源是《清实录》,我们把整个《清实录》从头到尾细读一遍,从里面收集皇帝惩治官员的全部信息,一共搜集到大约3万条惩治记录,这些记录包括了非常丰富的信息,如官员的姓名、官职,因为什么受到惩治,其他的涉案人员以及惩治的结果等,我们的研究团队花了很多时间将这些信息标准化,建立数据库。

图2是对基本史实的统计,即有清一代每一年皇帝对官员进行了多少次惩治,从中可以看到很明显的时间趋势特征,清前期、清中期和清后期是不一样的,特别是到了1860年之后,可以看到每年的惩治次数相对于前期和中期增长大概4倍以上。另外就是如果看每个皇帝的话,图2中的竖线表示每个皇帝在他统治的时间里面,哪一年惩治的数量是最多的。可以看到,不同的皇帝其惩治的高峰或者说惩治的波动是比较大的。

量化历史与历史政治学

如果分地区来看清代对官员的惩治,也有一些不同的特点,我们发现,那些官员被惩治多的地方在清代的前中晚三个时期都比较多。这说明,可能有一些不随时间变化的因素,同时影响到了对官员的惩治。我们发现,一个可能因素是一个地方,治理的难易程度。这具体体现为清代对政区的分等。为了更好地治理广阔的疆域,清代君主把不同的政区分成不同的等级,用来分等的标准,就是“冲繁疲难”这4种类型,也称为缺分。冲是地当孔道,用来形容交通;繁是指代政务纷纭;疲是描述赋税赋多逋欠;难是形容治安,指民刁俗悍、命盗案多。这是清代治理非常重要的制度安排,即把不同的府州县分成不同缺分。如果一个地方,在缺分分类中,“冲繁疲难”这四个字字数越多,表明治理就越困难,治理压力就越大。我们发现,治理压力越大、治理难度越高的地方,官员受到惩处的概率会越高。这是一个基本的发现。此外还有其他发现,包括依据不同的回归分析得出的结果,限于篇幅,不做展开。

基于上面的简单介绍,可以发现量化历史研究对历史政治学研究可能的价值。大致可以归纳为以下三点:第一,历史可以提供大量的、长时段的以及高质量的数据。首先,从数据量看,中国历史中有大量的数据,可以称为历史大数据。以清代为例,中国中央和地方各级档案馆,包括中国台湾地区和海外的图书馆这些机构保存了清代1000万件以上的档案,可以提供大量的数据。当然,里面的数据都是非结构化的,是一些文字描述,需要花很多时间把它结构化。比如在对吏治的讨论里,如果想知道官员的身份、姓名、来自何处、是否参加过科举考试、考试成绩是多少、有没有考中进士、社会网络的信息、因为什么而受到惩治、惩治之后是不是还有其他的一些处理等,就需要把这些史料记载的文字信息变成一个结构化的数据库。这个数据库的量非常大,我们在研究中不仅对《清实录》的史料进行了结构化处理,也处理了《明实录》和《二十四史》的史料,这样,对整个中国历史上皇帝惩罚官员的信息都建立了一个数据库。除了作为“大棒”——惩治的那一部分,也录入了作为奖励晋升的“胡萝卜”那一部分。像这样的历史大数据,是中国历史给研究者带来的一个非常大的优势。除了中央层面的档案,还有近万本的地方志,以及大量的其他地方文献,这为我们去研究历史政治学提供了重要支撑。其次,除了历史大数据外,中国历史还提供了长时段的数据。在王裕华教授介绍的研究里面可以明显看到,当研究者要关心一些大的制度、结构变迁的时候,必须把时间轴拉得很长。因为在很短的时间区间,如10年甚至50年的周期里面,很难看到一些重大的变革、族群之间的冲突等。中国历史的好处是可以研究很长的时间段,像我跟陈志武教授一起合作的关于政治稳定性的研究,就跨越几千年。最后,中国历史上的数据,不仅数量多,质量也很高。以朱批奏折等相关的档案为例,这些数据的质量非常高。因为这是当时实际政治运作留存下来的文书,虽然因为某些政治目的,对一些史实有所掩饰和修改,但对于大样本分析来说,这样的修改影响是很小的。今天,很难找到像清宫档案这样系统的史料,持续近300年,保存相对完整,这使研究者有很大的机会把文书运行背后的历史过程还原出来,进而从中发现历史规律,并检验已有的政治学等学科的理论。

第二,量化历史研究不仅对检验、完善社会科学理论有贡献,对理解当时的历史本身也有贡献。量化历史可以为检验理论提供一个实验室,这里的理论包括政治学理论和其他社会科学的理论。目前的社会科学研究,如果要检验一个理论,需要有高质量的数据,特别是当要做严格的因果关系检验时,需要考虑对照组、控制组,而历史常常能够提供这些检验必备的条件,比如外生冲击、准自然实验等。这种因果关系的检验不仅有助于修改一个已有的理论或者建立一个新的理论,也会帮助我们去理解历史,发现历史现象和人类社会背后的规律。

第三,通过量化的方法,对一些典型的史实进行量化,可以更有效地进行跨国和跨地区的比较。比如我跟陈志武教授合作的关于中国历史政治稳定性的研究。我们主要关心两个指标:一个是皇帝的命案,这里的命案是指皇帝被杀害或被迫自杀;一个是皇帝的在位时长。在图3中,横轴表示时间,纵轴表示每一年每位君主的生命风险,具体指标是看每一年一个君主死于命案的风险是十万分之多少。可以看到中国跟欧洲之间存在很明显的差别。公元700年之后,中国皇帝的命案在波动下降,欧洲君主的命案也在下降,但这两者之间还是存在很大的差别。中国是上下波动的,欧洲则是比较持续地下降。

量化历史与历史政治学

如果我们把皇帝命案换成君主在位时长的话,可以看得更清楚。我们比较了公元700年到1500年欧洲、伊斯兰国家和中国君主的在位时间。欧洲君主的在位时间,从700年到1500年整体都在上升,也就是政治稳定性是一直在上升的。而伊斯兰国家的君主在位时间从公元700年到900年在上升,但在900年之后一直在下降,也就是政治稳定性不断在降低。中国皇帝的在位时间,从700年到1500年,长的时候非常长,是世界上最长的,但是短的时候也非常短,是世界上最短的。换言之,历史上中国的政治稳定性存在非常大的波动。当然还可以把时间拉长,比如把时间延长到1500年之后,我们发现明清时期中国政治的稳定性是上升的。但是在大分流之前,中国和欧洲在政治稳定性上存在明显的差别。这个案例说明,对于一些跨国、跨地区的比较,如果有一些典型事实的量化分析,就可以很方便地把信息展示出来,从而开展有效地比较。

最后是一个简要的结语和对历史政治学研究的展望。首先,历史学对于历史政治学和其他社会科学都非常重要,它提供了数据来源,而这些数据的背后是丰富多样的政治实践和历史实践,它是对当事人真实活动的记载,这些记载能够帮助去检验、修改以及完善已有的理论,甚至推翻已有的理论,建立新的理论,这也是前面杨光斌教授讲到的历史政治学的目标。基于这些丰富的历史实践和历史数据,有很大的可能去实现这一目标。其次,虽然中国有这么丰富的历史实践,但是因为之前的很多工作并没有建立可靠的典型事实,所以中国历史研究对于政治学理论乃至整个社会科学理论的贡献,跟悠久的历史相比远远不成比例。王裕华教授引用了经济学家麦迪逊(Angus Maddison)的研究指出,中国的GDP长期以来在整个世界GDP中的占比一直很高,除了最近短短的一两百年,一直维持在20%—25%的区间,但看整个社会科学的理论,比如各个学科经典教科书里面的内容,会发现基于中国历史、基于中国实践所总结出来的概念和理论非常少,远远低于人口占比。我的分享希望说明,通过结合量化分析方法,把已经有的这些大规模史料和丰富的历史实践进行量化,在此基础上去分析相关关系乃至因果关系,将有助于我们在社会科学理论中发展、完善基于中国史实的概念和原理

  • 暂无推荐