本来,人与书的关系很简单,一个是知识的提供者,一个是知识的承载体。但自从电脑作为人类的辅助工具出现之后,这三者的关系就变得微妙起来。
相信不少人都用过曾经风靡一时的“作诗机”吧?只需要点击几下鼠标,一首有模有样的古诗便倏忽而就——尽管有时连您自己都读不懂那是什么意思。不过,作诗机与下面这个人电脑相比,就是小巫见大巫了。
菲利普·M·帕克
此人名叫菲利普·M·帕克,是欧洲工商管理学院的管理系教授。在60到70台电脑和6到7种他设计的程序的帮助下,帕克已经“写”了20多万本书,可能是有史以来最高产的“作家”。这些书每本大约150页,写作素材都来自于公开的信息,题材包罗万象。帕克的书甚至在亚马逊网络书店都有出售,下一步他还打算用电脑创作难度更高的文学作品。
不过,帕克并不是咱们今天要讨论的主角。因为像帕克一样寻求电脑帮助的人并不罕见。即使帕克的著作汗牛充栋,也算不上丰功伟业。真正卓绝的创意来自逆向思维,即,让电脑来求助于人类。
一切都要从验证码说起。
您肯定上过论坛吧?几乎所有正规的论坛都要求注册时输入验证码,这是为了防止乱发垃圾广告的家伙用注册机来恶意注册。这个源自美国卡内基-梅隆大学的发明被称为CAPTCHA(用于区分人类与电脑的全自动图灵测试)。因为注册者需要辨识图片上七扭八歪的文字,而这项工作只有真正的人类才能完成。
要知道,全世界的网络用户数以亿计,对个人来说,辨认文字所花的几秒时间微不足道,但如果将所有网民的力量利用起来,那便能完成难以想象的浩大工程。而这正是美国宾夕法尼亚州匹兹堡市的CMU研究小组正在做的事。
该小组受一家名为“互联网档案馆”的非盈利组织委托,要将海量的古老书籍和手稿通过OCR(光学字符识别)软件转化为电子文本,以方便电脑储存和查询。然而,由于原稿质量太差,可怜的电脑每扫描十个单词就会错读一个,唯一解决的办法就是人工核对,而这样的工作显然不是一个人或一个小组可以胜任的。
在辨认文字方面,电脑比人类笨得多
于是,CMU设计了一个名叫reCAPTCHA的强大系统,让他们的电脑去向人类求助。具体做法是:将OCR软件无法识别的文字扫描图传给世界各大网站,用以替换原来的验证码图片;那些网站的用户在正确识别出这些文字之后,其答案便会被传回CMU。
填验证码可以帮助完成古文本的电子化
为了提高用户辨识文字的正确率,他们往往被要求辨认两个单词,其中的一个的答案已经知晓。这样一来,正确辨认出有答案的那个单词的用户,很有可能也会正确辨认另一个单词。有时候,CMU也会将一个未经辨认的单词提交给不同的用户,如果得到的是相同的答案,那这个答案便可以肯定是正确的。
由于许多人气极高的网站,如Facebook、Twitter和StumbleUpon等,都采用了reCAPTCHA,CMU现在每天都可以处理大约一百万个单词。不过,按照现在的速度,要电子化“互联网档案馆”提供的所有文本,估计还需要400年。
其实,让人类来帮电脑的忙,这个想法并非CMU首创。早在2005年,亚马逊网络书店便推出了一个名为“亚马逊土耳其机器人”的网络服务。通过这个平台,程序员可以将一些电脑程序完成不了的任务交给人来做,比如从一组照片中选出最漂亮的那张、撰写产品说明书、辨认CD上的演奏者是谁等等,而接下这些电脑干不了的活儿的人也可以获得相应的报酬。
亚马逊土耳其机器人
不过,亚马逊只不过是较早地将这一创意付诸了实践。它真正的首倡者,或许应该是美国科幻作家哈里·哈里森。在1956年发表的科幻小说《天鹅绒手套》(The Velvet Glove)中,哈里森便描写了人类帮机器人查漏补缺的情形:
每当机器人遇到无法立即辨认出的物品时,它便将其放到你窗外的送料斗里。你仔细观察一番,如果仍旧拿不准的话,就查查目录,看它该归入哪类,然后摁下相应的按钮。
本文来自:
最热文章
人工智能写科幻小说,和作家写科幻小说有什么不一样?
德国概念设计师Paul Siedler的场景创作,宏大气派。
《静音》是一部 Netflix 电影。尽管 Netflix 过去一年在原创电影上的表现并不如预期,但是《静音》仍让人颇为期待
最近,美国最大的经济研究机构——全国经济研究所(NBER,全美超过一半的诺奖经济学得主都曾是该机构的成员)发布了一份报告,全面分析了 1990 到 2007 年的劳动力市场情况。\n
坏机器人制片公司最新的一部电影名为《霸主》(overlord),背景设置在二战时期,很可能是一部在半遮半掩中秘密制作的科洛弗电影系列。
我们都知道,到处都在重启;我们也知道,如果有钱,啥都能重启。所以,会不会被重启算不上是个问题,只能问什么时候会被重启。自然而然地,世界各地的各种重启现象衍生出了一个有趣的猜猜游戏:哪一部老作品会是下一个接受这种待遇的?\n