图片 5

她对人工智能究竟取得了多大进步感到困惑,智能学习时代

图片 1

人工智能和智能机器学习有什么不同?

来自:铅笔道 译自Medium 作者Brian Bergstein原文标题为A.I. Isn’t as
Advanced as You Think。梅勒妮·米切尔(Melanie
Mitchell)写了她的新书《人工智能:思考人类的指南》(Artificial
Intelligence: A Guide for Thinking
Humans),因为她对人工智能究竟取得了多大进步感到困惑。她写道,她想“了解事情的真实状态”。得知她的矛盾心理是一种安慰,因为她自己就是一名人工智能研究员。她是波特兰州立大学的计算机科学教授,也是著名的多学科研究中心圣达菲研究所(Santa
Fe
Institute)科学委员会的联合主席。如果米切尔对人工智能的立场都感到困惑,请原谅我们其他人的困惑,或者是谬误百出的见解。正如米切尔所指出的那样,许多有关人工智能胜利的故事正在流传。这些报告中,最近在计算机视觉、语音识别、游戏和机器学习的其他方面的突破表明,人工智能可能会在未来几十年很大范围的任务中超越人类的能力。有些人觉得前景不可思议;另一些人担心“超人类”计算机可能会判定不需要我们人类在身边,并有能力做些与此有关的事。我们要么离‘真正的’人工智能只有咫尺之遥,要么离了数百年。”但也如米切尔另外证明的那样,即使是当今最强大的人工智能系统也有关键性的局限。它们只擅长于狭隘定义的任务,对外面的世界一无所知;它们在数据中发现相关性,而不考虑数据的含义,因此他们的预测可能是非常不可靠的;它们没有常识。“要么取得了巨大的进展,要么几乎没有进展,”米切尔写道。“我们要么离‘真正的’人工智能只有咫尺之遥,要么离了数百年。”米切尔解决问题的方法使这本书具有纪念意义和启发性。她对当今人工智能技术的耐心解释给人的印象是,真正的机器智能还很遥远。她表示,电脑不仅需要更好的大脑,还可能需要更好的身体。米切尔提供了非常清晰易读的人工神经网络入门知识,该技术是图像识别,语言翻译和自动驾驶方面最新进展的核心。20世纪50年代和60年代,在最初的一些建立人工智能的尝试中使用了神经网络,但它们失宠了,因为看起来像一条死胡同,价值有限。但大约10年前有所改变,计算能力的进步使一种称为深度学习的数据密集型方法来训练神经网络成为可能。跟随米切尔对神经网络的描述,你不需要了解繁杂的的数学。她展示了数学主要是什么,这就同时解释了它们的威力和缺陷。一种对识别图像内容特别有用的神经网络依赖于一种叫做“卷积”的数学计算。处理文本的版本依赖于计算机表示语言统计方面的能力,即在穿过数百个维度的复杂“向量”里,单词在句子中出现的频率有多高。令人印象深刻的是,人们已经将世界上如此多的方面进行了量化,以供计算机继续工作。同样值得注意的是,这些方法有如此多样的应用,比如检测肿瘤、自动驾驶和过滤垃圾邮件。但是这种伟大计算器的巧妙新用途并不一定赋予它们与我们的智力相当的能力。正如米切尔所指出的,让卷积神经网络正常工作“需要大量的人类智慧”。机器学习系统本质上是统计工作,所以很清楚,为什么它们很容易受到所馈送数据中的不准确、漏洞和其他缺点的影响。难怪如果神经网络在主要显示白人的图像上经过训练,它就不能识别黑人的脸。当一辆自动驾驶汽车无法识别一个有贴纸的停车标志,但(对人类来说)它仍然是一个明显的停车标志时,就并不奇怪。幸运的是,这类问题已经引发了许多富有成果的讨论,这些讨论关于面部识别技术和自动决策的社会影响。纽约大学数据新闻学副教授梅雷迪思·布鲁萨德(Meredith
Broussard)在2018年出版的《人工智能:计算机如何误解世界》(Artificial
Unintelligence: How Computers The
World)一书中有说服力地提出,无论你是否称它为“人工智能”,计算机仍然应该被当作是被我们这些好奇的人类使用的工具,人类应该始终处于这个范围内。不过,尽管米歇尔并不是第一个指出机器学习系统弱点的人,她还是在评论中加了一层解释说,即使在它们处于最佳状态的时候,计算机可能也没有你想的那么好。在过去几年里,研究人员开发出了神经网络,他们声称,在识别照片或视频中的物体时,神经网络的表现达到甚至超过了人类的表现。这在新闻中被作为另一个必然对机器优势“抵抗无果”的例子。米切尔指出,讨论的基准是一个基于名为ImageNet的大型图片数据库的测试。2017年,最优秀的计算机系统对来自ImageNet的图片进行了分类,正确率达98%的top-5正确率,据称超过了95%的人类正确率。“top-5”的障碍是什么?这意味着正确的物体分类是机器作出的前五种猜测之一。米切尔写道:“如果给定一个篮球的图像,机器按这个顺序输出‘槌球’、‘比基尼’、‘疣猪’、‘篮球’和‘搬运车’,就被认为是正确的。top-5指标存在的原因可以理解:如果一张图片显示了不止一个物体,那么了解机器是否能检测出这些物体是很有用的。但它削弱了对极端技能的要求。米切尔表示,2017年,当该机器将正确的类别归置在其列表首位时,top-1的最高准确率仅为82%。至于说人类有95%的准确率,米切尔认为支持这一说法的数据站不住脚。在2015年发表的一个研究项目中,两个人尝试了ImageNet挑战的一部分。投入更多时间的人是安德烈·卡帕西(Andrej
Karpathy),他现在是特斯拉的人工智能主管。以top-5准确率作为衡量标准,他错了5%。而现在,这个数字被用作人类表现的标准。如果不是因为这个特殊测试的古怪之处,他的错误率可能会更低。卡帕西写道,他和另一名测试对象所犯错误的四分之一,不是因为他们对所看到的图片一无所知,而是因为他们不知道或不记得ImageNet中使用的一些确切的标签。更糟糕的是,“据我所知,还没有人报道过机器和人类在top-1准确率上的比较,”米切尔写道。凭借其快速和无尽的耐心,计算机是许多应用中图像识别的理想选择。在某些情况下,它们肯定比人类更准确。但说得太过了。“物体识别尚未接近被人工智能‘解决’的程度,”米切尔写道。我很难想象我们需要什么样的突破才能制造出这样一台机器。”人工智能目前最热门的话题之一是,如何让机器不仅检测数据中的统计相关性,而且在某种程度上理解它们正在处理的内容的意义。和米切尔一样,纽约大学的研究人员加里·马库斯和欧内斯特·戴维斯表示,如果没有这些改进,人工智能就不会“安全、智能或可靠”。在他们的新书《重启AI:构建我们可以信任的人工智能》(Rebooting
A.I.:Building Artificial Intelligence We Can
Trust)中,马库斯和戴维斯说,人们由于“可信度差距”而误以为计算机比它们更先进。他们写道:“我们不得不从认知的角度来思考机器(‘它认为我删除了我的文件’),不管机器实际上可能遵循的规则多么简单。”为了让机器变得不那么简单,许多研究人员正在重新探索用逻辑和常识来编码计算机的旧方法。以米切尔为例,她用类比的方式描述了她让计算机进行推理所做的努力。如果你想要一个电脑识别图像描绘“遛狗”,现在的基本方法是给它显示成千上万的遛狗的图片,然后使之相信那些照片中常见的事物——狗,皮带,手等。当机器看到之后遛狗的照片时,将触发一个积极的信号。然而,它可能会嗅出一些不寻常的遛狗行为。米切尔展示了一些例子,比如一张照片,一个人骑着自行车遛狗,另一只狗叼着另一只狗的皮带。她的研究小组正试图让计算机理解后一种情况是典型情况的“延伸”版本。那样的工作是辛苦而缓慢的。即使它成功了——如果一台电脑可以在某种程度上理解“遛狗”可以有多种形式——如果这台机器自己从来没有遇到过狗,这种理解能有多丰富呢?当我6岁左右的时候,我在我家附近的人行道上骑自行车,停下来看(也许还扔了)
一串从甜胶树上摘下来的带刺的种子球。突然,有人打开了街对面一所房子旁边的一扇门,出来一条棕色的狗,它犹豫了一两秒钟,然后径直扑过来,咬住我,撕破了我的灯芯绒裤子。这些记忆帮助我洞察到经历的无数方面——惊讶、恐惧和痛苦的感觉;一些狗的不可预测性;甜胶种子球的奇异古怪。相比之下,如果计算机被告知当人们说“something
bit them in the
ass”时并不总是一个习语,那就太肤浅了。哲学家和其他人工智能怀疑论者一直认为,没有真实身体的电子大脑只能学到盒子里这点东西。许多人工智能研究人员将这种怀疑归咎于“某种残留的神秘主义”——正如认知科学家安迪·克拉克(Andy
Clark)在1997年出版的《此在:重整大脑、身体和世界》(Being There: put
Brain, Body, and World Together
Again)一书中所写的那样,这是一种“对类似灵魂的精神实质的非科学信仰”。但是,当你考虑到爬行的婴儿能快速掌握基本概念,而数据中心的计算机需要大量的电力来吸收一个东西时,人工智能需要一个身体的这个想法就听起来相当不错。米切尔似乎不情愿地转变为怀疑论者的立场。“在与人工智能搏斗多年之后,我发现关于身体化的争论越来越有说服力,”她写道。那么,怎样才能制造出一个能在世界各地移动的机器人呢?这个机器人不仅能洞察自己的行为,还能洞察人类、动物和其他机器的行为。“我几乎无法想象,”她写道,“我们需要什么样的突破才能制造出这样一台机器。”

智能机器学习可能已取得了巨大成功
,但那只是实现人工智能的方式之一。在20世纪50年代人工智能领域诞生之时,人工智能被定义为任何能够执行具有人类智慧任务的机器。

图片 2

智能机器学习必将引领21世纪的机器人之路

人工智能系统通常至少会展示以下特征中的一部分:规划,学习,推理,解决问题,知识表达,感知,动作和操纵,以及社交智能和创造力。

除了智能机器学习外,还有其他各种用于构建人工智能系统的方法,包括进化计算,其中算法经历随机变异和代之间的组合以试图“演变”为最优解决方案。以及专家系统,其中计算机按规则进行编程允许它们模仿特定领域的专家,例如驾驶飞机的自动驾驶系统。

图片 3

智能机器学习有哪些主要类型?

智能机器学习分为两大类:有监督学习和无监督学习。

什么是监督学习?这种方法基本上都是通过例子来学习。

在监督学习训练期间,系统暴露于大量被标记的数据,例如标明了对应数字的手写数字图像。给出足够的例子,监督学习系统将学会识别与每个数字相关的像素和形状,并且最终能够识别手写数字,能够可靠地区分数字9和4或6和8。

但是,对这些系统进行训练通常需要大量标记数据,有些系统甚至需要暴露于数百万个示例才能掌握任务。

因此,用于培训这些系统的数据集可能非常庞大,Google的开放图像数据集包含大约900万个图像,其带有标签的视频存储库YouTube-8M可链接到700万个带标签的视频,ImageNet是这类早期数据库之一,拥有超过1400万个分类图像。培训数据集的规模继续增长,Facebook最近宣布已经编辑了35亿张在Instagram上公开发布的图片,并使用每张图片的标签作为标签。在ImageNet的基准测试中,使用10亿张这些照片来训练图像识别系统的记录准确率达到了85.4%。

图片 4

标记训练中使用的数据集的繁琐过程通常使用群集服务进行,例如亚马逊机械土耳其人,它提供了遍布全球的大量低成本劳动力的访问。例如,ImageNet由两年近5万人组成,主要通过Amazon
Mechanical
Turk招募。然而,Facebook使用公开可用的数据来训练系统的方法可以提供另一种使用数十亿个数据集的训练系统的方法,而无需手动标记的开销。

智能机器学习必将引领21世纪的机器人之路

什么是深度学习和深层神经网络?

智能机器学习的一个子集是深度学习,其中神经网络被扩展到具有大量数据训练庞大网络中。正是这些深度神经网络推动了计算机执行语音识别和计算机视觉方面能力的飞跃发展。

各种类型的神经网络,有不同的优势和劣势。递归神经网络是特别适用于语言处理和语音识别的一类神经网络,而卷积神经网络更常用于图像识别。神经网络的设计也在不断发展,研究人员最近为有效类型的深度神经网络设计了一种更高效的设计,称为长期短期记忆或LSTM,使其能够快速运行,例如Google翻译。

进化算法的人工智能技术甚至被用于优化神经网络。该方法最近由优步人工智能实验室展示,该实验室发布了关于使用遗传算法训练深度神经网络以强化学习问题的论文。

智能机器学习必将引领21世纪的机器人之路

图片 5

智能机器学习用来干什么?

智能机器学习系统一直在我们身边使用,是现代互联网的基石。用于为您推荐在亚马逊上想要购买的产品或想要在Netflix上观看的视频。

每个Google搜索都使用多个智能机器学习系统,通过个性化搜索结果来了解查询中的语言,因此搜索“低音”的钓鱼爱好者不会被吉他的结果所淹没。同样,Gm人工智能l的垃圾邮件和网络钓鱼识别系统也使用经过智能机器学习的训练模型,让您的收件箱避开流氓信息。

虚拟助手如苹果的Siri,亚马逊的Alexa,谷歌助理和微软Cortana是智能机器学习最典型的例子。

除此之外,在许多其它行业中也有许多用处,包括:无人驾驶汽车,无人驾驶飞机的计算机视觉;聊天机器人和服务机器人的语音识别;人脸识别;帮助放射科医生在X射线中挑选肿瘤,帮助研究人员发现与疾病相关的基因序列,并找出可能导致医疗保健中更有效药物的分子;通过分析物联网传感器数据,允许对基础设施进行预测性维护等等。

相关文章

发表评论