智能

从“骗子”到“人类要被毁灭了” ,人工智能有怎样的发展过程?

曾梦龙 ·

“从 20 世纪 60 年代到 90 年代再到今天,从西洋跳棋到国际象棋再到围棋、三盘棋,三次人工智能在公众中引发的热潮——为什么处在风口浪尖的偏偏都是人机对弈?为什么会下棋的计算机程序如此风光?”

作者简介:

李开复:创新工场董事长、首席执行官兼人工智能工程院院长。李开复博士于 2009 年创立创新工场,曾任谷歌全球副总裁兼大中华区总裁、微软全球副总裁、苹果交互式多媒体部门副总裁。

1998 年,李开复创办微软中国研究院(后更名为微软亚洲研究院),在极短时间内创建了一个国际一流的计算机研究院,曾被《麻省理工技术评论》评为“最火的计算机实验室”。1988 年,李开复获卡内基梅隆大学计算机学博士学位,他的博士论文题目是 “非特定人连续语音识别系统”。同年,《商业周刊》授予该系统“科学创新奖”。他开发的“奥赛罗”人机对弈系统,在 1988 年击败了得过世界团体比赛冠军的选手。

王咏刚:创新工场技术副总裁兼人工智能工程院副院长。他毕业于北京大学,毕业后长期从事金融行业软件研发,任方正奥德公司技术总监。 2006 - 2016 在谷歌公司任 Staff Engineer 、资深技术经理等职,参与或负责研发的项目包括桌面搜索、谷歌拼音输入法、产品搜索、知识图谱、谷歌首页涂鸦(Doodles)等。

书籍摘录:

第三次 AI 热潮:有何不同?

2016 年 3 月,似乎人人都在谈人工智能。

AlphaGo 与李世石的一盘棋将普通人一下子带入科技最前沿。围棋人机大战刚刚尘埃落定,“人类是不是要被机器毁灭了”之类的话题就超出了科幻迷的圈子,在普通人中流行开来。每天,我都能在各种场合听见人们谈论人工智能,哪怕是在街头的咖啡馆里,也能听到“深度学习”这样的专业字眼儿;大大小小的人工智能“论坛”或“年会”如雨后春笋般在北京、上海、广州、深圳、杭州等地涌现出来,学术界的人工智能大师们在各种会议、商业活动和科普活动中奔波忙碌,马不停蹄;一边是专业的科研机构、高科技公司在谈论人工智能,另一边,银行、保险、能源、家电等传统行业厂商也都忙不迭地把“ AI ”或“ AI+ ”的标签贴在自己身上;创投领域就更是热火朝天,包括创新工场在内,每家高科技投资机构都盯紧了人工智能领域的初创公司——这种火热场面,和整个投资圈在 2016 年遇冷的大背景迥然不同。

可大家千万不要忘了,这并不是人机对弈第一次激起公众的热情。 1997 年 IBM 的深蓝战胜卡斯帕罗夫的那一天,全世界科技爱好者奔走相告的场景丝毫不比今天人们对 AlphaGo 的追捧逊色多少。再往前看, 1962 年, IBM 的阿瑟·萨缪尔开发的西洋跳棋程序就战胜过一位盲人跳棋高手,那时,报纸也在追捧人工智能,公众也一样对智能机器的未来充满了好奇。

从 20 世纪 60 年代到 90 年代再到今天,从西洋跳棋到国际象棋再到围棋,三盘棋,三次人工智能在公众中引发的热潮——为什么处在风口浪尖的偏偏都是人机对弈?为什么会下棋的计算机程序如此风光?

来自:flickr

纵观人工智能发展史,人机对弈只是人工智能在公众心目中的地位起起落落的一个缩影。对于人工智能的技术研发者而言,选择人机对弈作为算法的突破口,这一方面是因为棋类游戏代表着一大类典型的、有清晰定义和规则、容易评估效果的智能问题;另一方面也是因为具备一定复杂性的棋类游戏通常都会被公众视为人类智慧的代表,一旦突破了人机对弈算法,也就意味着突破了公众对人工智能这项新技术的接受门槛。

的确,每次人机大战以及计算机胜出的结果,都在公众视野中激起万千波澜。可反过来想一想,人类对计算机在棋类项目上胜出的心理承受力又是何等脆弱和可笑。跳棋程序甫一成熟,公众惊呼“智能机器威胁论”,可没过几年,习惯了计算机会下简单棋类的公众又转而挑衅地说:“下个跳棋有什么了不起,有本事去下复杂无比的国际象棋试试?” IBM 的深蓝刚刚战胜卡斯帕罗夫的时候,全世界关心科技发展的公众都在为人类的未来命运担忧,可没过几年,国际象棋和中国象棋程序就变成了再普通不过的计算机应用,在大多数人心目中,“下个象棋算什么智能?有本事去下奥妙无穷的围棋试试?”

网上流传着一幅有关“人工智能发展成熟度曲线”的漫画,形象地展示出人们在此前两次人工智能热潮中,从被人工智能在某些领域的惊艳表现震撼,到逐渐认识到当时的人工智能还有各种局限,以至于产生巨大心理落差的有趣过程。

网上流传的漫画:人工智能发展成熟度曲线

与其说这是人类自身的心理落差,不如说这是计算机是否具有智能的判定标准在不断被拔高。从会下跳棋就算智能,到会下象棋才算智能,再到会下围棋才算智能……到底有没有客观的评价尺度?到底要给计算机设定怎样的门槛,才能正式发给它一张“人类智慧”的鉴定证书?今天我们管 AlphaGo 叫人工智能了, 3 年之后呢? 5 年之后呢?

AlphaGo 之前,人们至少喊过两次“人类要被机器毁灭了!” 20 世纪 60 年代前后算一次, 20 世纪 80 年代到 90 年代前后也算一次。前两次人工智能热潮,每一次都释放过人类关于未来的瑰丽想象力,每一次都让许多人热血沸腾。但很不幸,两次热潮在分别经历了十数年的喧嚣后,无一例外地迅速跌入低谷,并在漫长的寒冬中蛰伏起来。

1998 年,我来到北京创立微软亚洲研究院的时候,正值当时人工智能的热潮开始消退,人们对热潮中随处可见的盲目情绪心有余悸,很多人甚至不愿再用“人工智能”这个词来指代相关的研发领域。在学术圈子里,一度有很多人觉得,凡是叫“人工智能”的,都是那些被过分夸大,其实并不管用的技术。结果,我们为微软亚洲研究院设定科研方向的时候,就经常主动回避“人工智能”这个字眼儿,而是选用“机器视觉”“自然语言理解”“语音识别”“知识挖掘”之类侧重具体应用领域的术语。 

仅仅因为人工智能的表现与普通人的期望存在差距,我们这些研究人工智能的人就羞于提及“人工智能”,这真是一件尴尬的事儿。

那么,今天这次人工智能热潮会如何发展呢?第三次人工智能热潮有何本质上的不同?几年后的我们是否还会像前两次那样,不但忘掉了曾经的兴奋,还愤愤地说人工智能都是骗子?学术界、投资界、商业界乃至普通大众还会像此前两次那样在热闹了一阵子之后就归于沉寂,甚至跌入冰点吗?

李开复,来自:由出版社提供

用高德纳技术成熟度曲线看AI发展史

和前面那张搞笑的“人工智能发展成熟度曲线”不同,学术界、产业界和投资界在谈到技术高潮与低谷时,经常会引用高德纳咨询公司(Gartner)推荐的技术成熟度曲线。

这条曲线显示出,几乎每一项新兴且成功的技术,在真正成熟之前,都要经历先扬后抑的过程,并在波折起伏中通过积累和迭代,最终走向真正的繁荣、稳定和有序发展。

高德纳咨询公司(Gartner)技术成熟度曲线(CC BY-SA 3.0,Wikipedia)

如上图的曲线所示,一种新科技的研发过程通常是这样的:初创公司接受第一轮风投,开发出第一代产品,虽然不成熟,但足以吸引一批早期接受者——粉丝。在早期阶段,产品的优点被粉丝放大,大众媒体跟风炒作,将该技术推向一个充满泡沫的膨胀期。随着盲目的追捧者激增,跟风研发、生产的初创公司越来越多,产品的不足被无限放大,负面报道开始出现,供过于求的市场竞争中,大批跟风入局的初创公司不是被兼并,就是走向倒闭,只有少数拥有核心竞争力的坚持了过来。跌入低谷后,第二轮、第三轮风投资金注入大浪淘沙后仅存的中坚企业,新一代技术和产品也随之问世,整个技术曲线步入稳步攀升的平台期和成熟期,潜在用户的接受程度也从5%以下逐渐提升到20%到30%,初创企业和风投资本开始迎来高额回报。

这条曲线概括了绝大多数高新技术的发展历程。更重要的是,每年高德纳公司都会根据当年度所有流行技术的发展、成熟状况,制作出一张当年各流行技术在高德纳曲线上的发展位置图示,标示出每种前沿技术是处在萌芽期、泡沫期、低谷期还是成熟期,以及每种未达成熟期的技术还需要几年才会真正成熟起来。技术人员、投资者经常根据高德纳曲线来判断时代潮流,选择投资方向。

将高德纳技术成熟度曲线对应到人工智能波折起伏的发展历程中,其实不难看到,人工智能此前两次表现出的热潮,更多应该被理解为一项新兴技术在萌芽期的躁动以及在泡沫期的过分膨胀。

王咏刚,来自:由出版社提供

20 世纪 50 年代到 60 年代,伴随着通用电子计算机的诞生,人工智能悄然在大学实验室里崭露头角。以艾伦·图灵(Alan Turing)提出图灵测试为标志,数学证明系统、知识推理系统、专家系统等里程碑式的技术和应用一下子在研究者中掀起了第一拨人工智能热潮。但那个年代,无论是计算机的运算速度还是相关的程序设计与算法理论,都远不足以支撑人工智能的发展需要。例如,计算机科学和人工智能的先驱艾伦·图灵就曾在 1951 年发表过一份写在纸上的象棋程序,可惜当年的计算机难以实现这样复杂的运算。这就像探险家发现新大陆一样,第一次踏足新大陆和真正让新大陆蓬勃发展起来是根本不同的两件事。于是,从 20 世纪 60 年代末开始,无论是专业研究者还是普通公众,大家对人工智能的热情迅速消退。

20 世纪 80 年代到 90 年代,也就是我在卡内基-梅隆大学发明非特定人连续语音识别技术并将其用于苹果计算机系统的时代——那的确是人工智能研究者和产品开发者的一个黄金时代。传统的基于符号主义学派的技术被我和其他同时代研究者抛弃在一边,基于统计模型的技术悄然兴起,并在语音识别、机器翻译等领域取得了不俗的进展,人工神经网络也在模式识别等应用领域开始有所建树,再加上 1997 年深蓝计算机战胜人类棋王卡斯帕罗夫,普通人的积极性一度高涨起来。

但是,那个时代的技术进步还不够好,不足以超过人类对智能机器的心理预期。拿语音识别来说,统计模型虽然让语音识别技术前进了一大步,但还没有好到可以让普通人接受的程度,测试环境稍稍变化就会造成识别效果大幅下降。那时,我在苹果公司开发的语音识别应用就更多被用于演示和宣传,实用价值十分有限。从整体上看,那一拨人工智能热潮仍然笼罩着浓厚的学术研究和科学实验色彩,虽然激发了大众的热情,但更像是跌入谷底前的泡沫期,远没有达到与商业模式、大众需求接轨并稳步发展的地步。

2010 年前后,准确地说,是从 2006 年开始,随着深度学习技术的成熟,加上计算机运算速度的大幅增长,当然,还有互联网时代积累起来的海量数据财富,人工智能开始了一段与以往大为不同的复兴之路。

例如, 2012 年到 2015 年,在代表计算机智能图像识别最前沿发展水平的 ImageNet 竞赛(ILSVRC)中,参赛的人工智能算法在识别准确率上突飞猛进。 2014 年,在识别图片中的人、动物、车辆或其他常见对象时,基于深度学习的计算机程序超过了普通人类的肉眼识别准确率。

ImageNet图像分类比赛历年来识别错误率的变化趋势

人们在 ImageNet 竞赛(ILSVRC)中取得的非凡成就是人工智能发展史上一个了不起的里程碑,也是当今这一拨人工智能热潮由萌芽到兴起的关键节点。随着机器视觉领域的突破,深度学习迅速开始在语音识别、数据挖掘、自然语言处理等不同领域攻城略地,甚至开始将以前被人们视为科幻的自动驾驶技术带入现实。此外,基于深度学习的科研成果还被推向了各个主流商业应用领域,如银行、保险、交通运输、医疗、教育、市场营销等,第一次实现了人工智能技术与产业链条的有机结合。

今天的人工智能是“有用”的人工智能

我觉得,和前两次 AI 热潮相比,这一次人工智能复兴的最大特点,就是AI在多个相关领域表现出可以被普通人认可的性能或效率,并因此被成熟的商业模式接受,开始在产业界发挥出真正的价值。

还是拿图像识别来说,在人工智能发展早期,如果一个计算机程序宣称可以识别出图片中的人脸,但它的识别准确率只有五成左右,那普通人只会将这个程序看作一个玩具,绝不会认为它拥有智慧。随着技术进步,当人脸识别算法的识别准确率提高到 80%甚至接近 90%的时候,研究者们当然知道,取得这样的进步十分不易,但这一结果其实还是很难被普通人接受,因为每五个人脸就认错一个,这明显无法在实际生活中使用——人们也许会说这个程序挺聪明,但绝对不会认为这个程序已经聪明到可以替代人类的眼睛。只有计算机在人脸识别上的准确率非常接近甚至超过普通人的水平,安防系统才会用计算机来取代人类保安完成身份甄别工作。也就是说,对于人脸识别这个应用,接近或超过普通人的水平才是我们关心的“绝对阈值”。

所以,我们说“人工智能来了”,其实是说,人工智能或深度学习真的可以解决实际问题了。在机器视觉、语音识别、数据挖掘、自动驾驶等应用场景,人工智能接连突破了人们可以接受的心理阈值,并第一次在产业层面“落地”,发挥并创造出真正的价值。

人工智能之所以有今天的成就,深度学习技术居功至伟。谷歌最杰出的工程师杰夫·迪恩说:“我认为在过去 5 年,最重大的突破应该是对于深度学习的使用。这项技术目前已经成功地被应用到许许多多的场景中,从语音识别到图像识别,再到语言理解。而且有意思的是,目前我们还没有看到有什么是深度学习做不了的。希望在未来我们能看到更多更有影响力的技 术。”

电影《人工智能》海报,来自:豆瓣

所以,关于第三次人工智能热潮,我的看法是:  

前两次人工智能热潮是学术研究主导的,而这次人工智能热潮是现实商业需求主导的。

前两次人工智能热潮多是市场宣传层面的,而这次人工智能热潮是商业模式层面的。

前两次人工智能热潮多是学术界在劝说、游说政府和投资人投钱,而这次人工智能热潮多是投资人主动向热点领域的学术项目和创业项目投钱。

前两次人工智能热潮更多是提出问题,而这次人工智能热潮更多是解决问题。

到底本次人工智能热潮是不是处于技术成熟度曲线的成熟上升期,到底能不能保持长期持续增长的势头,是不是会像此前的人工智能热潮那样,有跌入低谷的风险?我想,经过上面的分析,大家应该会有自己的判断。

题图为电影《人工智能》剧照,来自:豆瓣


原文链接 (已下线): https://www.qdaily.com/articles/40505.html
Wayback 快照: http://web.archive.org/web/20190623183233/https://www.qdaily.com/articles/40505.html
原始截图: http://ww3.sinaimg.cn/large/007d5XDply1g3xpoctgzhj30u0a2ihdw