什么是机器学习--中国数字科技馆

首页 > 音视频 > 音频 > 科学播报

什么是机器学习

<a href="../202006/t20200620_1029465.html">电动汽车的排放量有多大？</a>(科学播报) 0:00/0:00

最新发布时间： 2019-11-25

　　机器学习是人工智能在近期最重要的发展之一。机器学习的理念是，不将智能看作是给机器传授东西，而是机器会自己学习东西。这样一来，机器就可以直接从经验（或数据）中学习如何处理复杂的任务。

　　随着计算速度和用于编程的算法的巨大进步与发展，机器学习成长迅速。由此产生的算法对我们的生活开始产生重大影响，而且它们的表现往往胜过人类。那么，机器学习是如何工作的呢？

　　在机器学习系统中，计算机通常是通过在相同任务的大型数据库中进行训练，然后自己编写代码去执行一项任务。其中很大一部分涉及到识别这些任务中的模式，然后根据这些模式做出决策。

　　举个例子，假设一家公司正要招聘一名新员工，在招聘广告登出之后有1000个人申请，每个人都投了简历。如果要亲自一个个筛选，这实在太多了，所以你想训练一台机器来完成这项任务。

　　为了做到这一点，你需要把公司过往的许多应聘者的简历都记录下来。对于每一份简历，你都有记录表明这个人是否最终被聘用了。为了训练机器，你拿出一半的简历，让机器通过学习这些简历最终是否成功地申请到了一份工作来找出其中的模式。

　　这样一来，当机器收收到一份简历时，它就可以对这个人是否适合被雇佣做出判断。训练完毕，就可以接着用另一半简历来对机器进行测试。如果它的成功率足够高，也就是机器做出正确判断的概率够高，那么你就可以安心地让机器根据一个人的简历来判断他是否适合被聘用。在任何阶段都不需要人的判断。

　　为了更清楚地理解机器学习的过程，我们将以开发能够识别手写数字的机器为具体例子来考虑模式识别的问题。这样的机器应该能够准确识别一个字符所代表的数字，而无论它的书写格式如何变化。

　　数字识别的过程分为两个阶段。首先，我们必须能够将手写数字的图像扫描到机器中，并从这张（数字）图像中提取出有意义的数据。这通常是通过主成分分析（PCA）的统计方法实现的，这种方法会自动提取图像中的主要特征，例如图像的长度、宽度、线条的交点等。这个过程与求解矩阵的本征值和本征向量的过程密切相关，也与谷歌用来在万维网上搜索信息的过程非常相似。

　　然后，我们想训练机器从这些提取的特征中识别数字。一种非常主流的用来训练机器的方法是神经网络。神经网络算法的最初灵感来源是我们认为的人类大脑的工作方式，但并不严格地建立在我们认为的人类大脑的工作方式之上。

随着训练数据的增加，算法会更新其选择的直线。（图片来源：University of Bath）

　　首先要创建一组“神经元”，并将它们连接起来，它们可以相互发送消息。接下来，让神经网络去解决大量已经知道结果的问题，这样做能让算法“学习”到应该如何确定神经元之间的连接，以便能成功地识别出数据中的哪些模式导致了正确的结果。

　　将许多感知机耦合在一起就可以进行更多的计算，但这一发展必须等待更强大的计算机的出现。当多层感知机耦合起来形成一个神经网络时，这一重大突破就出现了。这种神经网络的典型结构如下图所示，它包括输入层、隐藏层和输出层。在这种情况下，输入会组合起来以触发感知机的第一层神经元，由此产生的输出也会组合起来以触发下一层神经元，最后，这些组合起来给出最终的输出。

层数越多，神经网络就越“深”。（图片来源：University of Bath）

　　然后，这样一个神经网络就会通过为上面的神经元之间的每个连接分配加权而得到训练。这个过程是为了模仿大脑神经通路强化或衰减的方式。深度学习描述了训练这样一个神经网络的过程。

　　神经网络学习的过程有多种形式。在监督学习中，用户会事先提供一组成对的实例，也就是输入和输出。然后，学习的目标是找到一个给出的输出能与实例匹配的神经网络。通常，用来比较神经网络的输出与实例的输出的方法是计算两者的均方误差；然后对网络进行训练，让这一误差对所有训练数据集最小化。这种方法的一个非常标准的应用是在统计学中使用的曲线拟合，它对手写数字和其他的模式识别问题都有很好的效果。

　　在强化学习中，数据不会由用户事先给出，而是由神经网络控制的机器与环境交互作用时生成的。机器会在每个时间点上对环境执行一个操作，由此生成一个观察结果，以及这个操作的成本。然后训练这个神经网络去选择那些将总体成本降至最低的操作。在许多方面，这个过程类似于人类学习的方式。

　　机器学习进展迅速，在更快的训练算法和越来越多的数据的驱动下，发展更复杂、更深层神经网络的趋势越来越明显。

原创稿件

制作：西南交通大学曾子芹

专辑里的声音
	去除甲烷可以缓解温室效应吗？
	利用惯性原理可以突破传统火箭的速度吗？
	机器人集群工作会更高效吗？
	太空望远镜要多大才有可能发现外星生命？
	穿山甲是否是新冠病毒中间宿主
	全球新冠肺炎大流行
	免疫系统的起源
	乐高成为隔热新材料
	柔性机械“昆虫”诞生
	真核生物属于古细菌吗
	流感病毒是如何逃过人体免疫系统识别的？
	肿瘤患者感染新冠肺炎病情更重，恶化更快
	何种疗法对新冠肺炎疗效更加显著
	是穿山甲把新型冠状病毒传染给了人吗？
	新冠病毒与流感病毒有何不同？
	首个人类冠状病毒是怎样被发现的？
	冠状病毒真的可怕吗
	可高效回收的高性能塑料
	复杂网络助力抓住恐怖分子
	不需要引擎的飞机
	时空是连续的吗
	为什么我们难以见到反物质
	飞行器应该像鱼还是像鸟
	晚上服用降压药效果更好
	什么是电子皮肤
	蓝光电子屏会加速衰老
	宇宙会保留黑洞吞噬掉的信息吗
	海豚有“第六感”吗？
	大脑中的想法可以被直接读取吗？
	红外光能改变水分子的结构吗？
	胰岛素可以口服了
	激光也可以传递声音吗？
	我们如何观测银河系之外的天体？
	今天的水星值得我们去探索吗？
	又有两种海洋生物被发现了
	森林砍伐是亚马逊森林火灾频发的关键原因
	磁铁有助于提高水电解氢性能
	发射失败的卫星也可以作为研究工具吗？
	火星和金星哪一个更适合人类居住？
	今年是历史上最热的一年吗
	智人在多久以前开始走出非洲
	碳捕集技术能帮助我们阻止全球变暖吗？
	子宫与女性的记忆能力有关吗？
	磁铁可以是液态吗？
	有氧运动有望治疗偏头痛
	精神疾病与免疫系统的异常有关吗？
	二氧化硅材料可以提升火星宜居性
	大脑的性别差异究竟有多大？
	手机信号可以用来监测雾气吗
	骨头里的胶原蛋白也是一种“指纹”吗？
	声音最大有多大？
	不同动物之间可以进行心脏移植吗？
	质子也有寿命吗？
	贫富差距可能导致物种损失吗？
	含糖饮料增加患癌风险
	为什么日冕的温度要高于太阳的表面？
	医疗服务应该注重性别差异吗？
	太极对身体有什么好处
	多喝牛奶可以降低全因死亡风险
	宇宙是否真的发生过大爆炸？
	为什么不能长时间戴耳机
	土卫二上可能诞生生命吗？
	睡眠不足会导致“社恐”
	如何探测地球深处
	过度睡眠可能增高全因死亡率
	肥胖可以改变大脑形态
	为什么口腔伤口愈合得更快
	猴子也会制造石器吗？
	生命可能由陆地起源吗？
	地衣是生物还是生态系统？
	试管婴儿为何患高血压风险更高
	计算机运算速度真的在指数倍增长吗？
	为什么十字花科蔬菜能防癌
	黑洞吞噬一颗恒星需要多久？
	戒烟与糖尿病有关吗
	氢气也能作为超导材料吗？
	人到底有多少个基因
	口哨声也能表达语言吗？
	衰老可以被逆转吗
	孕期压力会对胎儿生长发育产生不良影响
	高脂肪低碳水竟能抑制肿瘤生长
	常见氨基酸可显著提高化疗效果
	过敏可以预防皮肤癌
	运动可以治疗腰疼吗？
	脱发会增加患癌风险
	喝茶可降低心脏病风险
	我们需要益生菌吗？
	长时间缺乏睡眠显著降低认知能力和注意力
	人为什么会自言自语？
	第四种物质状态——等离子体
	心脏可以长出新血管吗？
	植物有眼睛吗？
	很多人说蚊子喜欢O型血，但真的是这样吗？
	母乳喂养会影响婴儿的饮食喜好吗？
	疱疹病毒可能导致阿尔兹海默症
	精神疾病与大脑的酸性有关吗？
	发生时间接近的记忆更容易产生关联吗？
	真空真的是空的吗？
	无创近视手术有望实现
	胎儿具有成熟的免疫系统吗？
	人造感觉神经诞生
	超级T细胞受体有助杀死遭HIV感染的细胞
	常见止痛药有望成为抗癌药
	辨别色彩的能力是与生俱来的吗
	记忆可以移植吗？
	电子书更不容易记住吗
	尼安德特人为什么面部中间前凸
	注射胚胎干细胞真的能续命吗
	记忆可以剪辑吗
	睡眠其实是工作的一部分
	日光照射能够改善学习记忆
	植物有听觉吗
	生酮饮食有益大脑？
	360度全景相机
	0是不是自然数
	我们看到的月球为什么只有一面
	体内储存特殊脂肪酸可以延长寿命？
	甲状腺激素可能影响抑郁症发病率
	飞机玻璃到底有什么特别之处？
	口服胰岛素有望实现
	吃菠萝为什么嘴会麻麻的？
	咖啡和茶，谁更提神？
	过敏性鼻炎
	火药起源
	犀牛走向灭亡
	核磁共振预测自闭症
	生命真的起源于海洋吗？（3）
	生命真的起源于海洋吗？（2）
	生命真的起源于海洋吗？（1）
	虚粒子：更深层的物理学线索（下）
	虚粒子：更深层的物理学线索（上）
	性别新知：性别认同（下）
	性别新知：性别认同（上）
	与自己对话：大脑中的声音（下）
	与自己对话：大脑中的声音（上）
	生命真的起源于海洋吗？（上）
	神秘的纳莱迪人之谜告破（下）
	神秘的纳莱迪人之谜告破（上）
	宇宙学对撞机：两个极端尺度的交融（下）
	宇宙学对撞机：两个极端尺度的交融（上）
	卡西尼号的遗产（下）
	卡西尼号的遗产（上）
	婴儿哭声里的疾病信号（下）
	婴儿哭声里的疾病信号（上）
	切掉一半大脑，你也能活？
	把酒卖贵点，就能减少犯罪？
	长寿有迹可循？
	为什么保守秘密让人精疲力竭
	畅聊数字化生存
	海洋酸化破坏鱼类感知系统
	深夜睡不着？可能是因为你有失眠基因
	即使关机，手机还是会偷走你的睡眠
	你的大脑能上传到数字化世界吗
	酷刑逼不出真相
	几十年来，我们一直搞错了阿尔兹海默病背后的元凶？
	逼退英军的德国，却没能及时造出原子弹
	“科学家告诉我，多吃脂肪能长寿？”你想多了

导航

热门搜索