智能

IBM 的人工智能项目也想要智能识图,但是结果有点糟

谢若含 ·

要不要来试试 IBM 人工智能理解图片的准确率?

IBM 研发的沃森人工智能最近提供了一个开源网站,这个叫做 IBM Watson 图像识别,现在你就可以试了。

这个图像识别的在线工具只需要你给出相应的图片或者链接,在几秒钟之内它会分析出它所看到的内容。

好玩儿的是,对于一些风景图片,这个工具的识别能力还不错。比如下面这张风景图,沃森的图像识别系统将图片中的内容进行分类,最后呈现的结果是每个类别在图片中所占的比例。

这张沃森准确率比较高:峭壁 72% 户外 70% 天空场景 68% 风景 67% 绿色 67%

但是如果上传一些人像图片给沃森分析,它得出的结果就显得有些诡异了。我们来扔一张乔妹的照片试试。可能是乔妹长得太水灵,所以图片得出的结果中,孩子的成分占了 65% 的比例,还有 66% 的冰锥是什么情况?难道是因为图片的冷色调背景吗?

算是毫无难度的人脸照,沃森猜对了一个关键字:冰锥66% 人物60% 孩子65% 庆祝63% 成年女性61%

再比如电影《布鲁克林》的这张剧照,电脑识别结果认为庆典、毕业、以及动物抚养这些主题都占比 60% 以上。但是当我们看过这部电影,理解了电影内容之后,便会明白这幅图片实际传递的意义,而绝不仅仅是通过一些色调或者人物动作来理解图片内容。

这张基本就不准了:抚养65% 签证65% 场景63% 庆祝63% 毕业63%

但这对于计算机来说其实是非常困难的,斯坦福大学视觉研究中心的教授李飞飞解释到:“ 通过 ‘看’图片,我们实际上‘理解’了这个画面。‘视觉’从眼睛采集信息开始, 但大脑才是它真正呈现意义的地方。”

让计算机理解图片,是人工智能领域的一个重要分支,如果能使得现在最智能的机器在视觉上拥有更强大的功能,在许多领域上我们或许又会有更进一步的突破。

沃森的路还很远。

题图来自 Youtube


原文链接 (已下线): https://www.qdaily.com/articles/24200.html
Wayback 快照: http://web.archive.org/web/20190623174811/https://www.qdaily.com/articles/24200.html
原始截图: http://ww3.sinaimg.cn/large/007d5XDply1g3x5gpiuwtj30u03qk7wh