搜索
取消

热门搜索

专题
首页  >  专题  >  科技知道

可以用机器研究历史吗?

  大概在四五十年以前,美国历史学界曾经出现过一种崇尚以统计数据来撰写论文的热潮。这一风潮之下出现了一些比较机械的研究,简单介绍情况就开始堆数据,仿佛“数据覆盖面有多广,写出来的历史覆盖面就有多广”,而历史的本质:经验、感觉、物质或情感的联系、媒介等则受到轻视。这些工作本身不一定切题,又或许作者的“统计”完全是建立在对历史实践一知半解的基础上。其结果是,生产了不少空有一堆数据、底层框架或问题出发点却错误的研究。

  当然,也应该看到历史研究是在演进的,人习得的知识可以教给机器。特别是近些年出现的大文本方法,对文本的吸收能力比单凭数据肯定是要强。然而,历史研究的本质是通过表象(史料)寻找过去的本相,而这种本相只能在人的意识中感知,而不会出现在另一种表象中。事实上,现在的大文本方法,也仍然有这种问题:通过文本方法能捕捉一些“联系”、抓出许多数据,但这些东西背后所蕴含的非文本因素,既然其价值与影响决定于人类阅读获知它们时的情感,那么对历史的判断和把握,也就不能舍弃人工。

  这并不是说量化历史无意义。事实上,随着定量社会科学研究的兴起,历史学研究当中有许多领域早已“社科化”进而变为定量研究,这一部分的量化乃至机器自动处理都是可以做到的。笔者之前听过一个报告,基于当地报纸数量、销量等研究两次大战之间德国和波兰两座城市的公民政治参与问题,这种研究显然机器化就很容易。然而更多的领域没有被剥离出来,往往更像“人文”而非“社科”。比如说研究18世纪中国部分省份的粮政筹划,这种研究里没有数据,文本也多是只言片语,含义必须结合语境来理解,这种东西即便未来有机器学习前景,大概也得很久以后了。

  总而言之,机器学习可以简化历史研究,但它还不能实现历史研究。历史学工作最底层的一部分,恰恰就是把那些关于过去的、混沌不明的记忆转化为今天的人们可以理解的知识——这一步其实是在机器之前的。

  ■ 知乎ID:司马亮 中国古代史在读博士生

特别声明:本文转载仅仅是出于科普传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或其它相关事宜,请与我们接洽。
[责任编辑:北京科技报]
 收藏:0
分享到:
文章排行榜
? 2011-2017 版权所有:中国数字科技馆
未经书面许可任何人不得复制或镜像
京ICP备11000850号 京公网安备110105007388号
信息网络传播视听节目许可证0111611号
国家科技基础条件平台