2018年1月14日至17日,香港科技大学人文社会科学学院院长、著名历史学家李中清教授在人文楼四层大会议室做了“从大数据理解中国:1700-2000”为主题的系列演讲, 系统介绍了李中清康文林团队的研究构想与研究成果。该演讲系清史研究所与香港科技大学人文社会科学学院共同合作《缙绅录》项目研究计划的一部分, 也受到人民大学教师国际培训计划的支持。演讲第一场由清史研究所所长朱浒教授主持,第二至第五场由副所长胡恒副教授主持。
作为此次系列演讲的第一讲,14日演讲的主题是Big Data and Big Collaborations,Old Methods,New history:Past,Present and Future Projects。
演讲伊始,李中清教授开宗明义地指出本次演讲将会从整体上介绍量化历史的研究方法,交流从事量化历史研究的经验,讨论对量化史学与传统史学区别的理解, 并对后续的四次演讲进行简要的介绍。李中清教授指出,自科学革命以来,事实上形成了一种学科分流。在科学革命以前,所有学科基本上从事的是一种解释性的研究, 而在科学革命兴起之后,理学等逐渐成为一门发现的学问,它们推翻了以往的种种解释,发现了许多新的现象和规律。然而人文社会科学所从事的多仍是一种解释性的研究。 李中清教授认为量化数据库的运用将会在人文社会科学学科中拉近发现和解释之间的距离,从而发现新的现象,修正过往的理论。
李中清教授谈到他们团队的研究旨在通过运用量化数据库,发现当代中国及历史中国到底有什么特色,对比中国与世界其他地区的异同,以更加清晰地理解当代中国。在介绍了几类西方的量化数据库后, 李中清教授分析了相对于传统史学的材料,量化数据库所具有的优势:其一,不同于传统史学研究中非常零碎且难找的史料,量化数据库所能提供的材料相当丰富;其二,量化数据库不止能计算一些平均值, 而且能够依靠大量的数据进行更细致的分析,进行类似理学的试验,提出一些假设;其三,量化研究能够充分与其他社会理论进行结合,对既有的宏观概括进行修正或提出新的理论。就方法论意义上的目标而言, 量化历史将运用社会科学的方法分析大量的历史数据以获得新的历史认识,这样的研究将把微观数据与宏观比较结合起来,将过去与现在联系起来。就具体的研究方法而言,主要分为五个步骤, 第一是寻找数据,第二是录入数据,第三是对数据的描述,第四是对数据的分析,最后则是对成果的结构性叙述。
接着李中清教授对此后的四次演讲进行了概要性的介绍,四次演讲分别是李中清教授等领导的多个科研团队在过去多年所做的学术研究工作的汇总,运用四种不同类型的量化数据库所进行的对中国社会的研究, 第二讲讨论的核心是谁能拥有后代,第三讲的核心是谁能获得教育,第四讲的核心是谁能获得财富,第五讲的核心则是谁能获得权力。通过对1700-2000年时段内上述几个问题的研究,试图从整体上理解中国,并进而从一个比较的视野理解整个人类社会的特征。
李中清教授也谈到了自己对传统史学与量化史学区别的理解,就传统史学而言,它要求研究者对研究题目有比较深入的了解,而且往往是依靠个人的能力独立完成的, 在方法上它在归纳推理的基础上依靠直觉的敏锐性进行论证;而就量化史学而言,它需要研究者能够细心的输入材料并加以分析,量化研究更需要团队的合作来达成目标; 就方法而言,它依靠对数据的计算分析,并在此基础上进行逻辑论证。
最后李中清教授分享了自己的一些研究成果和心得,如《人类的四分之一:马尔萨斯的神话和中国的现实》一书的研究方法和基本结论。
第二讲的主题是:“Who Gets Descendants?”,是李中清教授关于人口史比较研究成果的介绍。这项研究历时20年,从1994年一直持续到2014年,李中清教授和他的团队收集了中国、 日本、意大利、比利时、瑞典等地数个村庄完整的人口统计资料,将其录入电脑进行量化分析,以图揭示在社会经济条件不平等的情况下,不同地区的人口发展的反应。 研究的成果最终以三本著作与一系列论文的形式得以呈现。三本著作分别是2004年出版的《Life Under Pressure》,主要涉及死亡率的分析;2010年出版的《Prudence and Pressure》, 主要讨论出生率的问题;2014年出版的《Similarity in Difference》,主要讨论婚姻相关的问题。本次演讲也主要围绕着死亡率、出生率和婚姻等核心问题展开。
经李中清教授及其团队的研究,就死亡率而言,西方社会人口的死亡率更多与财富相关,即在短期的经济压力条件下,粮价的上涨或收入的下跌对无地贫民来说将造成致命打击, 导致其死亡率急剧增长,而对于有地的、拥有更多财富的人而言,他们则拥有更多的机会存活下来。然而在亚洲,面对同样的短期的经济压力,却并没有呈现出一种类似的由财富关系主导的死亡率的上涨。 相较于西方这种贫穷与富裕阶层之间死亡率的高低差异,亚洲社会主要呈现出不同社会类型人口之间死亡率的高低差异,比较显著的是差距悬殊的男婴与女婴的死亡率。它证明了人口行为的空间差异, 引导人们思考财富和权力等因素在东西方社会所具有的不同的意义。
就出生率而言,东西方社会总体上都呈下降的趋势,但西方社会的人口出生率始终高于东方社会,这也就引出了婚姻的问题。在李中清教授看来,西方与东方的出生率之所以不同在很大程度上在于婚姻方式的不同, 西方在天主教的影响下很早便有婚姻自主的传统,这就形成一种浪漫的婚姻关系,使得夫妻间有更积极的性行为。而在天主教教义下,将生孩子作为一种神圣的使命,更加促进了出生率的提高。 以中国为代表的东方社会则不然,父母指定的婚姻关系使得夫妻间很难形成一种浪漫的氛围,而且女方往往花费大量精力去应对婆媳关系等繁琐的事务,男方则不敢违背母亲的意愿与女方过于亲密, 也影响了出生率的提高。
最后李中清教授也提到了家庭在东西方社会中对婚姻的不同影响。在西方社会,由于孩子倾向于独立,如果一个孩子跟父母住在一起,那他则更少可能结婚,而在东方, 由于孩子需要依靠父母提供的资源,与父母在一起则更有可能促使他们建立婚姻关系。以此引申开来,李中清教授也提到家庭结构的不同,在西方多为一夫一妻的简单家庭, 而在东方孩子结婚后与父母住在一起的家庭则要更多。
系列演讲第三讲的主题为:Who Gets Education?
李中清教授介绍到这个主题是他的团队正在做的新的研究,而本次演讲将主要介绍从1865年至2014年这150年间,中国教育精英(高等教育)及其动态演变,通过利用大量的数据, 分析这些教育精英们家庭背景及地区来源的变化,并试图理解中国的考试制度对于实现社会流动的意义。
李中清教授认为总的来看,教育精英的家庭背景在这150年间经历了一个从小范围的同质化群体如绅士阶层到一个更大范围的异质化群体如行政管理人员、商人、无产者等的转变。具体而言,李中清教授将这150年分为四个阶段进行了展示。 第一阶段为1865—1905年,这一阶段有70%的教育精英是政府官员的子弟;第二阶段是1906—1952年,这一阶段大于60%的教育精英是商人或专业人才的孩子;第三个阶段是1953—1993年, 这一阶段大于40%的教育精英来自工人或农民家庭;第四个阶段是1994—2014年,大于50%的教育精英来自有产者家庭(针对所谓有产者,后面有进一步分析)。李中清教授也注意到四个阶段考试内容的变化, 从科举时期的儒家经典到民国时期的西学,再到建国后对理学和应用科学知识分量的提高,再到最后一个阶段与全球教育的接轨,事实上不同社会背景下对知识的定义也会影响到教育精英群体来源的转变。
提供教育精英的家庭除了在职业来源上经历了这样四个阶段的变化,就地区来源来说,也经历了转变。李中清教授将地域因素考虑进去后,对四个阶段做了进一步具体的说明。第一阶段大于70%的教育精英的家庭背景是全国范围内的所谓“绅士阶层”,第二阶段大于60%的教育精英来自江南和珠江三角洲地区的专业人才和商人家庭, 第三阶段来自无产者家庭的大于40%的教育精英出自全国范围内各省高中系统,而到了第四阶段,这些来自有产者家庭大于50%的教育精英实际上来自地区性的特定的重点高中。
通过一系列的定量分析,李中清教授结合现实指出,在当今中国,相对公平、开放、客观的高考制度实际上仍是有利于社会流动的。在大部分西方国家,教育精英主要来自只占人口规模很小部分的富裕家庭;而中国的教育精英则来自不同的职业和地区。 总的来说,不管是相对于中国传统还是当下以美国为代表的西方社会的现实,在实现精英教育生源多样化,给予社会中下层子弟教育晋升途径方面,高考的作用依然是比较突出的。
1月17日14点整,李中清教授主讲了“从大数据理解中国:1700-2000”系列演讲第五场。
李中清教授从《缙绅录》出发,介绍了这种文献包含的清代数百万官员的姓名、籍贯、职位等信息,强调要将《缙绅录》与进士题名录等其他史料结合起来。他通过大数据的整理、分析, 研究了清代官员的组成、科举成绩与初任职位、旗人身份与官缺获取等一系列问题,得出了很多有价值的结论。比如,举人身份大多任官在七品以下,且升至四到六品的举人官员数目低于捐纳升官的人数。 此外,旗人身份对于任官的意义应被充分认识。李教授团队的初步研究表明,在一至三品的高级文官中,满人占60%左右。大量统计数据反映出旗人比进士更有可能担任高级官员,在一些部门比如理藩院里, 百分之百都是旗人。相较以往研究多关注科举功名,《缙绅录》数据提供了更多官员们的官职和身份背景信息,将使我们对清代官制的理解更加立体和全面。
在演讲过程中,李中清教授与现场师生就量化研究的贡献、量化数据库的运用以及量化史学中的跨学科研究等问题进行了热烈讨论。系列演讲引发广泛关注,多位来自校内外经济学、 社会学、艺术学、人力资源管理、新闻传播学等专业的学者参与讨论,气氛热烈融洽。演讲结束后,艺术学院的陈浩老师向李中清教授赠送了《颐和春意图》,至此,“从大数据理解中国: 1700-2000”系列演讲取得圆满成功。
(陆泓江  王善  尉彦超采写)
附:演讲海报