可以用机器研究历史吗？--中国数字科技馆

大概在四五十年以前，美国历史学界曾经出现过一种崇尚以统计数据来撰写论文的热潮。这一风潮之下出现了一些比较机械的研究，简单介绍情况就开始堆数据，仿佛“数据覆盖面有多广，写出来的历史覆盖面就有多广”，而历史的本质：经验、感觉、物质或情感的联系、媒介等则受到轻视。这些工作本身不一定切题，又或许作者的“统计”完全是建立在对历史实践一知半解的基础上。其结果是，生产了不少空有一堆数据、底层框架或问题出发点却错误的研究。

当然，也应该看到历史研究是在演进的，人习得的知识可以教给机器。特别是近些年出现的大文本方法，对文本的吸收能力比单凭数据肯定是要强。然而，历史研究的本质是通过表象(史料)寻找过去的本相，而这种本相只能在人的意识中感知，而不会出现在另一种表象中。事实上，现在的大文本方法，也仍然有这种问题：通过文本方法能捕捉一些“联系”、抓出许多数据，但这些东西背后所蕴含的非文本因素，既然其价值与影响决定于人类阅读获知它们时的情感，那么对历史的判断和把握，也就不能舍弃人工。

这并不是说量化历史无意义。事实上，随着定量社会科学研究的兴起，历史学研究当中有许多领域早已“社科化”进而变为定量研究，这一部分的量化乃至机器自动处理都是可以做到的。笔者之前听过一个报告，基于当地报纸数量、销量等研究两次大战之间德国和波兰两座城市的公民政治参与问题，这种研究显然机器化就很容易。然而更多的领域没有被剥离出来，往往更像“人文”而非“社科”。比如说研究18世纪中国部分省份的粮政筹划，这种研究里没有数据，文本也多是只言片语，含义必须结合语境来理解，这种东西即便未来有机器学习前景，大概也得很久以后了。

总而言之，机器学习可以简化历史研究，但它还不能实现历史研究。历史学工作最底层的一部分，恰恰就是把那些关于过去的、混沌不明的记忆转化为今天的人们可以理解的知识——这一步其实是在机器之前的。

■ 知乎ID：司马亮中国古代史在读博士生

本文来自：《科技生活》周刊

特别声明：本文转载仅仅是出于科普传播信息的需要，并不意味着代表本网站观点或证实其内容的真实性；如其他媒体、网站或个人从本网站转载使用，须保留本网站注明的“来源”，并自负版权等法律责任；作者如果不希望被转载或其它相关事宜，请与我们接洽。

[责任编辑：北京科技报]

导航

热门搜索

可以用机器研究历史吗？

恭喜您完成注册！

注册失败！

导航

热门搜索

可以用机器研究历史吗？

分享到微信朋友圈

恭喜您完成注册！

注册失败！