内容检索:
 
当前位置: 网站首页>>专题研究>>史学理论>>正文
葛剑雄:大数据在历史研究中没有太大必要
2019-08-09 23:33 葛剑雄  随读随写 审核人:   (阅读: )

新科技与历史研究

葛剑雄

(复旦大学历史地理研究中心)

摘要:现在新技术层出不穷,有的已用在历史研究上,取得了一定的成果,引起了社会关注,但在历史研究中,传统的研究方法并没有过时,出现新技术时不要先急切地用于历史学的学术研究,还是要看它的实际效果,是否经得起时间的检验。

关键词:科技历史研究史学理论

现在我们可能都感受到,人工智能已经在多方面对我们的学习、生活造成了冲击,今天我要谈的主要就是科技的新进展对我们历史研究到底起什么作用。前段时间有人在北京做了一个实验,让两个人和一个机器人同时接受电视访谈,然后看他们的采访效果,结果,看画面的人知道哪个是人哪个是机器人,可听声音的人没有分辨出来。机器人技术已经非常发达了:很多新闻报道的稿子都是机器人写的,法院也开始引进机器人,一些简单的判决书都可以由机器人独立完成。我在想,我们历史领域可能早晚也要引进机器人,比如教历史,机器人的普通话肯定比我标准,讲的内容也保证不会错。更不要说制造业,我曾经到一个大的制造业工厂去参观,他们说现在很多工作都是机器人在做,因为机器人对工作环境的要求不高,还可以24小时连续工作。

面对以上种种,我们就在考虑,机器人到底能不能超过人类,这个趋势我们应该怎么对待?其实从表面上看,机器人已经超过了人类,比如世界上段位最高的棋手已经在阿尔法狗面前认输了,但这是不是就代表机器人已经具备了人的思维能力了呢?幸好没有,因为现在阿尔法狗的程序是程序员写的,还并不是自主思考的结果。到目前为止,人工智能只进入了物理阶段,它还没有进入化学阶段,更没有进入生物阶段,人工智能要进入生物阶段进而具备人脑的功能,我个人认为,这将是一个很漫长的过程。但即使是现在,人工智能也已经对我们的生产、生活产生了很大的冲击。

在考虑人工智能能不能运用时,我们要看它的综合效益,特别是它的社会效益,比如历史上曾出现的工人捣毁机器的运动,就是短时间内机器的大量推广而造成的后果。我们现在也面临这个问题:如果送货的无人机普遍推广,那么中国一半的快递小哥就将面临失业;现在无人驾驶汽车技术取得了重大突破,在运用上已经没有什么困难,但是如果我们过快地采用它,全世界这么多专职司机到哪里去呢?

类似的例子有很多,比如我以前在复旦大学图书馆当过7年的馆长,图书馆就面临这个问题:我们馆以前有一个很大的部门,20多个馆员专门干什么呢?为新书编码。现在就不用,全世界都有一个系统,直接在网上就把编码输入进去了,现在书商都能供应已经贴好编码的新书。所以在我当馆长期间,编码的这个部门就被撤销了。有一年美国图书馆协会的一个副会长来上海做报告,说不久以后传统图书将会消失,大家都将会在电脑终端上进行阅读和学习,这一度引起很大的恐慌,特别是我们馆里一些学历不高的中年馆员,都在担心下岗问题。我说你们放心,至少在我当馆长期间不会让你们下岗。为什么呢?因为机器确实可以解决一些问题,但是还有些东西是完全没有必要用机器的,这都是人为促进消费的结果。比如有次一家企业要送给我两台自助借还机器,每台价值30万!我问为什么,他们表面说的好,敬重你啊什么的。这不是很明显吗?你要了人家一台,后面还要不要呢?我让副馆长去考察:这个机器售价30万,每年的维护费用大概34万,寿命10年,可仔细一看,这就是一个简单的自动售货机,只是把放饮料改成了放书,而且它对图书本身和摆放要求得还很严格,一不小心就卡壳了。一年花好几十万的机器我们需要吗?雇一个人比它便宜得多,效率不知高多少。

以前还有好多人要求我们图书馆要24小时开放,我就说你们都要有休息日,我们图书馆怎么就不能有呢?现在都有网络,在任何时间、任何地点只要登录进去就可以看书,何必非要到图书馆?两年以后大家都同意我了。我讲这些想说什么呢?就是我们不一定要跟着科学技术的发展走,你要看采用它的目的是什么,也要看它对我们这门学科、这个社会的综合效益怎么样。比如现在我们什么事情都喜欢做PPT,难道没有PPT你们就听不懂我的话吗?英国一些传统贵族学校和名牌中学是禁止使用PPT的,他们就认为传统教育的每个环节都有其独特的益处。对这种观点,我是同意的。

应该承认,科学技术的进步总体上是促进社会发展的,但是社会发展还有它自身的规律。比如我们在环境恶劣的流水线上推广机器人就是有必要的,然而那些人可以做、成本也不高的工作,还运用机器人就是在剥夺我们劳动者的饭碗,更何况有些机器人的知识产权还在别人手里呢!更深一步想,我们人存在的价值是什么?有人试想过:我躺在床上机器人就把所有事情都做好了。难道你要躺一天吗?不要以为什么都不做就是一种幸福。挪威是世界上最富裕的国家之一,人均年收入在8万美元以上,但是它的自杀率在发达国家中也是最高的,从摇篮到坟墓什么事情都是政府安排,如果自己再找不到生活的乐趣,那活着还有什么意义呢?社会进步难道就只包括生活条件进步、物质条件进步吗?精神要不要提升,怎么样才算提升?还有,随着科学技术的发展,原来不可能的事情变得可能了,我们原来认识的界限就可能被突破,你怎么应对呢?比如说大家以前都反对人有灵魂,可现在科学家正在研究暗物质,虽然现代仪器暂时还没办法把它探测出来,但是重庆有个实验室就在地下2000多米的地方研究它,如果暗物质被发现了,那么灵魂就不可能是附着在暗物质上吗?

回到今天的演讲主题,我们研究历史到底是为了什么?周振鹤老师说历史是介于科学与人文之间的学科,我很认同这个说法。从科学部分来讲,任何科学研究的结论都必须符合两个条件,一是可验证,二是可重复。比如说我们研究马克思,马克思的存在、他的著作等等,这都是属于科学部分;另一方面,对马克思主义理论贡献、它要达成的最终目标等问题的研究,这都是人文的部分,因为这些是无法验证的。比如说共产主义一定会实现,可能我们有生之年都看不到,怎么验证呢?霍金对物理学做出了很大贡献,有些人就说为什么他不能获得诺贝尔奖呢?很简单,他讲的很多都是一种可能,这些可能有的甚至需要几十亿年才能得到验证,因而从科学的角度出发,他是没办法被承认的。

人文学科有其自身特点,现代科技对人文学科的研究有一定帮助,但还是不能代替长期形成的研究范式。比如说对移民史研究有影响的基因测试,前段时间曹操墓被发现以后,复旦大学就有老师宣称他们可以通过基因手段来确定这个人是不是曹操,我当时就跟其中一个人讲,这是不可能的。因为基因比对的前提是你首先要找到标准的曹操后人,可这个样本不同于族群样本,实际上找不到,找到了也未必被“曹操后人”所承认。还有,现在很多人都说自己是孔子的后代,孔家人认同孔子,真的仅仅是因为血缘的关系吗?这是文化认同,你用基因测试也是行不通的。可见,一旦牵扯到人类社会,它就不仅仅是科学鉴定的问题。

在移民史研究中,人类迁徙作为一种社会现象,它就不是简单的科学事实,这需要科学与人文的结合。又比如说,现在人类学一般认为最早的人类起源在非洲的埃塞俄比亚高原,如果说我们也是由黑人进化来的,从人文方面来讲,很多人就接受不了。此外,总是有人跟我说,为什么不把人类学的这些研究成果运用到移民史上呢?我说完全没有必要,因为我们研究的是最近2000年,特别是最近1000年的移民问题,前面的跟我们没有任何关系。

我们现在运用一些科学技术,不是在用技术,而是在炫耀技术,这其实解决不了问题。当初电脑才出来,就有人宣称用电脑计算出日本在新石器时代有多少人。我说这是骗你的,即使他研究出来,怎么验证呢?另外一个例子——大数据,我当初也想设计一个运算方法,然后把移民有关的数据都编入到特定的程序里面去,这样电脑就可以自动推算出一个结果。可后来我也放弃了,为什么呢?运用现代科学技术,我有两个衡量标准,那就是,首先它最后的精确度有没有其他方法加以验证;其次,它的结果有没有意义,能不能改变一个重大的学术论断。我发现大数据在历史研究中还是没有太大必要,因为我们掌握的数据不够,而且很多都是二手甚至三手数据,盲目运用的结果就是可信度越来越低,误差也会越来越大,到最后还是需要我们人来做出判断和取舍,这是没有必要的。还比如天气预报,它是大数据的典型,现在相当一部分大部头的电脑都用在这上面,复杂的卫星云图用高速计算机几秒钟就可以被计算出来,但是它算出来的只是一种可能,最后的取舍也还是需要人根据历史经验去做出判断,所以为什么我们历史气候资料重要呢,就是这个原因。

另外说一点,现在大家都在说气候变暖,我个人是不怎么赞同的,因为完整的气候资料全球都只有100多年的历史,你怎么能轻易下这个结论呢?大数据地应用可以提高现有计算的精度,但它主要只适用于当代社会,适用于原始数据很全、很正确的情况,在数据本身不全、不正确的情况下,它是无法弥补空缺的。还有个问题,如果我们花了很大精力去运用科学技术解决问题,最后却只是微小地修正了现有研究结果,那研究还有意义吗?我投资几十万甚至上千万、用很多助手,结果研究出原来你某人书里说这里移民最少10万,可我算出的是11万,而且同样无法验证,那有多大意义?在科学不断发展、新的技术不断涌现的情况下,我们人文学科要看到现代科技的真正意义,既要明确自己的研究目的,还要考虑综合效益,谨慎地去采用新技术,不要忘记自己的社会责任感。当然,有些科技我们还是要运用,比如GPS、无人机拍摄等,这都是有益于我们学术进步的。

总的来说,我个人还是认为,我们传统的研究方法并没有过时,出现新技术时我们不要一拥而上,还是要看它的实际效果,是否经得起时间的检验。好了,我要讲的就是这些,感谢大家。

(华中科技大学历史研究所研究生王星根据201855日葛剑雄教授在华中科技大学历史研究讲座的现场录音整理,收入《华中国学》2019年春之卷。经授权,本公号转载)

文章来源:随读随写

上一条:荣维木 | 怎样运用口碑史料撰写口述历史
下一条:葛兆光:后现代历史学的洞见与不见