智能

一张图片的价值

王嘉俊 ·

不久的将来,图片会改变我们生活的方式。

每天 7 亿的照片分享,100 亿美元的估值,这是成立三年的公司 Snapchat 给出的成绩单。Snapchat 的成功得益于图片社交的潮流,互联网女皇 Mary Meeker 去年 5 月预测全球每天上传 5 亿照片,一年之后这个数字变成了 18 亿。

图片正在改变这个时代,但现在仅仅是开始。

对图片价值的挖掘,目前还停留在非常表面的地步。社交分享、拍照留念是主要的用途,但在更深的层次上,例如机器学习、精准索引、信息传递,技术的限制让图片难以发挥更大的作用。

这也意味着图片的潜力,一篇来自 OM 的文章对此说得很详细。

图片应该有更大的作用,比较生活化的例子是记录生活。过去我们用文字描写生活,例如朱自清先生的 《荷塘月色》: “曲曲折折的荷塘上面,弥望的是田田的叶子。叶子出水很高,像亭亭的舞女的裙。” 有人开玩笑说朱自清先生如果现在到荷塘散步,那就是:哇,今天荷塘好美。拿起手机咔擦一下就回去了。


这当然是个笑话,但也说明了图片在记录生活的作用。对于 95 后甚至 00 后的年轻人来说,拍照就是生活的一部分。手机的广泛传播、应用的方便使用给记录生活增添了新动力。

生活化的记录,是个人记忆的索引。对于整个社会来说,图片不仅传递个人记忆,而且能传递越来越多的东西。互联网的发展把人类联系在一起,但语言始终是难以逾越的障碍。图片是可能的解决方法,无论是在巴西、中国还是委内瑞拉,笑容就是笑容,小鸟就是小鸟。图片是全世界通用的语言。

图片的可识别性和人类大脑对图片的接受和处理方式有关,人们能够超越语言理解图像化的场景。另一方面,图片也让我们的理解更为高效,尤其是在信息爆炸的今天,它有更深刻的意义。

当我走出大门看周围,我看到了王大锤坐在门边,右手边有一只可爱的小兔子,眼睛透露羞涩的光芒。如果用文字理解,那得经过阅读、内化和理解三个步骤,就像你现在做的一样。但图像理解在潜移默化中就可以完成。

有一份研究对此进行了详细说明,人类大脑的图像识别时间是 150 毫秒,理解时间是 100 毫秒,不过天然呆的据说不在此列。

在人类大脑的理解中,超过一半都是视觉驱动的。这也启发了机器人行业,开启了计算机视觉的研究。

在计算机视觉研究中,汽车是比较通俗的例子。很多汽车都有摄像头,它们会上传大量带有地理位置的图片信息,它们能够给无人驾驶汽车提供很多学习材料。

Dropcam 摄像头也是这样,它们安静地观察家里的情况,这些数据积累起来能够对家庭机器人进行培训。

当然,现在的图片技术有很多问题,也有很高的门槛。

至少,我到现在还很难找到想要的图片,无论它是存储在我的电脑中,还是在百度的服务器中。对图片进行索引是一件非常困难的事情,我要如何去描述这样的图片?

这也带来监管难度。非法图片远比非法文字难以监管,因为它难以索引,也就难以把非法图片区分出来。

图片也耗费大量的带宽和存储空间。要对图片进行挖掘学习,需要大量的资料库,这也是为什么只有 Google、百度和雅虎之类的大公司,才有能力做这样的事情,虽然目前为止还是做得不如人意。

但是,图片依然有很大的价值。就像以上这 2000 字,都抵不上一张图片的信息。


题图来自:OM


原文链接 (已下线): https://www.qdaily.com/articles/4391.html
Wayback 快照: http://web.archive.org/web/20190623155434/https://www.qdaily.com/articles/4391.html
原始截图: http://ww3.sinaimg.cn/large/007d5XDply1g3vhlvr0pdj30u048ykjl