当时光已成往昔,如何才能测量历史上某一时期社会对某一群体的刻板印象呢?或许我们可以通过阅读过去的作品推算出曾经的偏见,但是刻板印象往往不能简单地从词句中获得。研究者们最近开发了人工智能的方法来量化刻板印象,他们利用这一方法分析历史数据,从而了解哪些刻板印象依旧广泛存在,而哪些曾经的刻板印象正在逐步消亡。
该研究团队使用机器学习的方法来量化人们的印象偏差,机器学习,简而言之就是利用电脑分析大量数据从而揭秘其中隐藏的规律。研究者们使用了机器学习以及自然语言处理中的“词向量”的办法对词语进行量化:根据词语所处的语义环境和相邻的其他词语将单词用向量表示。例如,如果人们对女性的描述倾向于“情绪化”,那么“情绪化”这一词语往往更容易和“女性”这一词语同时出现,“词向量”可以捕捉这一相关性:“情绪化”的词向量在性别这一坐标轴上将会更偏向“女性”。
基于这种方法,研究者们首先确认了“词向量”这一方法是否能够比较准确的反映不同历史时期的刻板印象。他们利用“词向量”这一方法分析了过去几十年内的英文出版物,发现机器学期所得到的“词向量”与同一时期关于性别和族裔的刻板印象的调查结果吻合度很高,证明了该方法的有效性。随后研究者们利用词向量的方法分析了从1910年到1990年美国的报纸,书籍和杂志所提取的两亿词语来研究未被调查统计过的刻板印象。
随着社会的发展,研究人员发现与能力有关的词语,诸如“资源丰富”,或者“聪明”,与男性性别刻板印象的相关性正在缓慢减小。但是与外貌特征相关的描述性词语,比如“诱人的”或者“相貌普通的”在刻板印象方面却没有明显的变化,过去的几十年内,这些词语的“词向量”仍然大大偏向于描述女性。在人种和宗教信仰方面:亚洲名字与曾经的刻板印象:“圈外人”或者“不直接”的联系正在逐渐减小;而根据纽约时报1988到2005年的数据显示,在1993年和2001年纽约世贸大厦的恐怖袭击后,恐怖组织相关的词语和穆斯林相关的词语联系得越来越紧密。虽然生活在不同历史时期和不同地域的人们无法直接告诉你他们的刻板印象,幸运的是他们也无法隐瞒自己的刻板印象。上述研究最近刊登在最近的美国科学院院报上。
原文:Matthew Hutson
翻译:矫骏逸