分享到:

谷歌凭什么打败苹果的Siri?

[来源:] 2012-07-31 08:54:00 编辑:翻来翻去 点击:

文/QUENTIN HARDY 翻译/陈柳 发
文/QUENTIN HARDY   翻译/陈柳  发表于 纽约时报中文版

语音识别技术不仅对于手机产业来说至关重要,而且对很多其他设备,特别是电视机的控制来说,也十分关键。该技术目前尚处于初级阶段,但如果你在思考,到底“苹果语音助手”(Apple’s Siri)和“谷歌语音搜索”(Google Voice Search)谁会在这场竞争中取胜,那就想想拼写检查给我们的启示吧。 

当埃里克·施密特还是谷歌首席执政官的时候,我问他,谷歌到底拥有什么,能让它不被任何新出现的搜索引擎打倒。拼写检查,他回答道。谷歌仔细研究了输入查询框的数十亿信息的拼写错误和修正,因此非常清楚用户出现像“thsi”这样的拼写错误时,他们实际想要表达的意思是什么。有了这种了解,谷歌在搜索中提供了“您是不是想找”的功能,最终做到了在人们完成输入之前,就将问题补充完整。

他表示,其他公司不会有这样的学习积累,因为人们已经开始指望搜索引擎来修正他们的拼写。客户仍会继续使用已经解决了这个问题的谷歌。微软必应证明,施密特关于谷歌独有拼写检查功能的说法并不完全正确,但也只有微软这种规模的大公司才能应付这样的问题。

现在,使用谷歌来检查拼写在全世界都很普遍,而且在谷歌内部,同样的辅助性知识也经常应用于新产品。

这也许就是“谷歌语音搜索”似乎深受我同事尼克·比尔顿(Nick Bilton)追捧的原因。在安卓操作系统“软糖豆”(Jelly Bean)的升级版中,它看起来和Siri相似。尼克说,“谷歌语音搜索”对他所说的话识别能力似乎更强,而且回答问题也更出色。网上也有大量视频展示了这款产品的威力。

如果说谷歌的表现更好,这极可能是因为谷歌2007年推出的一款产品为上述技术奠定了基础。这款产品名为“谷歌411“(Google-411),或称“谷歌本地语音搜索”(Google Local Voice Search)。这款产品表面上是为了提供免费信息查询,其实让谷歌最感兴趣的,是掌握不同人的发音方式。

虽然语音搜索的“软糖豆”版本最近才推出,但谷歌语言学家已经有了5年数十亿不同发音的数据积累。一年前,谷歌就有一个包括2300亿词组的数据库,这还只是英语。谷歌还在致力于 23个其他语种的开发。这些开发很大程度上都以“411”及相关语音搜索产品为基础,其中还包括一个“语音搜索”的早期版本。这又是另一种拼写检查。

苹果从来不曾进行类似功能的研发,这也是为什么Siri成为苹果官方以测试版形式发布的少数产品之一。在Siri的早期阶段,它的语音数据库逐渐建立。当Siri不明白一个问题的时候,它有一些可爱的表达方式,比如重复你刚才的话,也许实际上,这就是为了看你是否会纠正它的理解,这和谷歌掌握拼写检查的方法类似。虽然“谷歌语音搜索”的“软糖豆”版本出现较晚,但它建立在早期研究基础上的质量优势,正是它在初级阶段表现突出的原因。

开发一个产品是为了另一个产品,语音识别并不是谷歌这么做的唯一领域。安卓系统上的“谷歌眼镜”(Google Goggles)应用,使用电脑图像识别技术,能帮助确认用户所拍摄的物体,也是一款能与谷歌地图(Google Maps)联合使用的产品。你可以用“谷歌眼镜”拍一条街,如果谷歌地图也用“街景”(Street View)车拍过这个地点,它就能告诉你,你现在是在什么地方。


本文由翻来翻去授权虎嗅网发表,并经虎嗅网编辑。转载此文章须经作者同意,并请附上出处(虎嗅网)及本页链接。
原文链接http://www.huxiu.com/article/2212/1.html
分享到: