智能

人工智能图像识别大赛最后一年举办,胜者多是中国团队

马若飞 · ·

计算机的图像识别在特定目标识别上已经超越了人类。

7 月底,举办第 7 年的 ImageNet 图像识别竞赛公布了 2017 年的比赛结果,27 支参赛团队超过半数来自中国。其中 WMW 团队以 2.25% 的错误率赢得了图像分类竞赛,团队三人来自北京初创公司 Momenta,一人来自牛津大学;物体识别比赛中,DBAT 团队的识别精确度为 73.1% ,比去年的 66.3% 更进一步,团队成员有 8 人来自南京大学,两人来自伦敦帝国学院。

2014 年,Google 获得了大赛的优胜,但之后就没有再参加比赛。而且,今年的 ImageNet 大赛将是最后一次举行。

ImageNet 是什么?

简单的说,ImageNet 是一个给人工智能用的视觉识别库,里面都是包含定义和分类的图片。比如哺乳动物这个词条包含猫、狗等所有哺乳动物,下一级分类就细分为猫、狗等分类,其中单独包含这些分类的图片。

现任斯坦福大学副教授,曾在普林斯顿研究人工智能的华裔科学家李飞飞是 ImageNet 的创始人之一。这个数据库一开始并不包含“竞赛”的性质,2007 年到 2009 年,ImageNet 利用人工、互联网分时雇佣平台等传统方法,收集了超过 320 万个被标记的图像,分为 12 个大类别, 5247 个小类别,比如哺乳动物、汽车和家具等等。

现在的计算机图像识别,基本上都是在一个算法的基础上,用大量分类图片来训练,以达到识别特定物体的效果。举例来说,如果想让一个 AI 认识猫,就必须给它看很多很多猫的照片,不同角度、花色、姿态,最终 AI 可以判断任意一张图片里是不是有猫。

所以,作为一个定义图片库,ImageNet 不仅可以用来训练 AI,还能够验证 AI 是否准确认出了图片里的内容。2010 年开始,ImageNet 设立了竞赛规则,开始邀请全世界的计算机科学研究者参加竞赛,比赛内容是比较算法识别特定图像的错误率。

2012 年的 ImageNet 比赛是一个里程碑。那年,来自多伦多大学的 Geoffrey Hinton、Ilya Sutskever 和 Alex Krizhevsky 提交了名为“AlexNet"的深度卷积神经网络算法,这种算法的图形识别错误率低至 16%,比第二名低超过 40%。可以这么说,人工智能在“看特定的图”这件事上第一次接近了人类。

从此,深度卷积神经网络算法成了主流的研究方向,图形识别的错误率也一再降低。2015 年的比赛中,计算机看图的错误率已经低至小数点后两位——百分之几,研究者认为,计算机在这种特殊的任务中已经超越了人类。

2015 年之后,由政府资助,中国人参与的团队开始在 ImageNet 里获得更好的成绩。2016 年,公安部第三研究所资助的 Trimps-Soushen 获得“图像目标定位”单项的第一名;南京信息工程大学团队 NUIST 获得“视频中物体探测”子项目的第一;监控摄像机厂商海康威视 HikVision 获得“场景分类”单项的第一。

简单的说,近两年来获奖的项目,主要致力于特殊的任务,比如视频监控和识别。2014 年,Google 组建的团队 GoogLeNet 把物体识别的准确度从前一年的 22.6% 一下提高到 43.9% 之后就不再参加 ImageNet。而今年之后,ImageNet 将停止竞赛论文的提交。

因为基于分类图片的图像识别已经非常准确,没有太大的发展空间了。未来图像识别人工智能的研究将转向没有标注的图片和视频。

未来,由苏黎世联邦理工、Google Reasearch、卡耐基梅隆大学等共同组织的 WebVision 竞赛将接替 ImageNet 的地位,WebVision 的数据直接从网络抓取,没有经过标注,可能本身就包含很多错误的信息,而且分类也更多。从另一个角度来说,这种数据训练出的人工智能,在模糊识别的能力上将更接近人类。

未来,更先进的计算机图形人工智能,或许会在城市监控、罪案侦破方面替代人类,在自动驾驶等领域创造新的生活和工业模式。


题图/bigsnarf.wordpress


原文链接 (已下线): https://www.qdaily.com/articles/43728.html
Wayback 快照: http://web.archive.org/web/20171209082355/http://www.qdaily.com:80/articles/43728.html
原始截图: http://ww3.sinaimg.cn/large/007d5XDply1g3xun0uutqj30u03n94qp