智能
Skype 帮助我们再造巴别塔?
全世界所有人都能够不受语言限制进行交流是一个伟大的梦想,很多科技公司都发此宏愿,但是实际应用却困难重重。这一次微软携 Skype Translator 自信而来,它能够帮助我们再造巴别塔吗?
记得《星球大战》里那位金光闪闪、能够翻译一切对话的自动翻译机器人 C-3PO 么?
微软想让你直接在 Skype 上用到同样的服务。今日,Skype 向公众发出邀请,以测试其即将在年底发布的 Skype Translator 同步语音翻译功能。
第一批支持的 12 种翻译语言包括了几乎所有主要语言:英语、中文普通话、粤语、法语、意大利语、韩语、俄语、德语、日语、葡萄牙语、西班牙语、阿拉伯语。
微软研究院机器翻译组对文字翻译的研发已经持续 10 余年,他们之前的重要成果早已被应用在必应翻译中。但不同于必应只需要专注于文字翻译,语音翻译面临着更大的困难,机器对个人话语习惯理解的困难性使得研究进展迟缓。
语音翻译过程大致分成三个阶段:
- 首先将接收到的声音信号转化成电脑可以识别的文本;
- 接着就是普通的文字翻译过程;
- 最后是将翻译完的文字通过文语转换系统(TTS)形成声音。
显而易见,与语音翻译的难度主要体现在第一阶段,此前业界主要发展的技术方向是高斯混合模型(GMM),而今天被广泛研究应用的深层神经网络(DNN)模型并不起眼。
但事情在 2009 年迎来了转机,微软研究小组通过将协同发音建模与深层神经网络结合起来,使得语音识别的效率大幅度提升。2012 年天津,微软研究院举办的“21 世纪的计算大会”中,微软研究院全球负责人 Rick Rashid 通过这一技术,将他的演讲实时翻译给了在座的与会者,起到非常好的效果,可以看看视频:
2014 年 5 月底,在美国举办的 Code 大会上,微软 CEO Satya Nadella 首次将 Skype Translator 作为一个产品公开演示。
今天微软发出的测试邀请预示着 Skyper Translator 完成度已经比较高,在新社交网络的冲击下,MySpace 早已于 2011 年关闭,在刚刚过去的 10 月 31 日,曾经风靡一时的 MSN 也被关闭。
Skype 如今已成为微软在移动领域与社交领域仅剩不多的重要阵地。相比刚被 Facebook 收购的 WhatsApp 和 Google 2013年刚发布的 Hangouts,微软耕耘已久的 Skype 还是有一定的优势。可以想见,在新 CEO Satya Nadella 的 One Microsoft 战略中,Skype 将肩负整合现有资源的重任,而 Skype Translator 会否就是微软的亮剑之举呢?我们拭目以待。
原文链接 (已下线): https://www.qdaily.com/articles/3277.html
Wayback 快照: http://web.archive.org/web/20190623151807/https://www.qdaily.com/articles/3277.html
原始截图: http://ww3.sinaimg.cn/large/007d5XDply1g3v6yyn3t5j30u03hvkjl