分类:
2008-10-16 18:35:43
北京时间8月19日《商业周刊》文章指出,预计语音识别技术的市场需求将在未来几年显著增长,IBM的语音研究组正在积极寻求合作,将这项技术推出市场。
据悉,美国军方利用IBM研究公司的创新语音识别技术解决了驻伊士兵和伊拉克民众之间的通信问题。 驻伊士兵可以利用笔记本电脑或PDA的麦克风讲话,电脑中安装的软件就可以将他们的话翻译成阿拉伯语。伊拉克军队士兵和民众听到的是阿拉伯语,他们的回答会马上被翻译成英语。 目前大约有1万套这种系统正在交战地区使用。
但是这也凸显出IBM研究公司面临的一个巨大难题:当军队在选择新医疗记录网络的语音识别技术时,他们选择了市场领袖Nuance Communications的产品。 因为IBM的全部专业知识和资源及其全球基础研究部门的3000多名科学家面临着一个重要的挑战,即必须将他们的创新成果从试验室推到市场上。
IBM研究公司语音与翻译分公司的首席技术官David Nahamoo希望改变这种情况。 他在8月18日在纽约SpeechTEK 2008大会上宣布了一项新战略。 语言研究组并不打算通过IBM来推广其技术,而是打算与其他厂商合作将这项技术带到市场上。它的合作伙伴包括Vlingo、PhoneTag和Jajah等。 Nahamoo说:“我们可以寻找合作伙伴,分散风险,改善我们开拓市场的能力。”
IBM研究语音识别技术已经有四十个年头了。其中有些技术已经被应用到IBM的软件和服务之中。 但是这项技术的影响力还没有达到Nahamoo和公司其他高管预期的水平。他们认为这项技术可以应用于汽车、手机、呼叫中心、医疗系统和翻译服务等领域。 这些应用领域都代表着一个相对较小的细分市场。因此IBM需要在各个领域都找一个合适的合作伙伴。 技术咨询公司TMA Associates的总裁William Meisel说:“这项新战略让IBM的有了用武之地。”
从整体上说,随着手机日渐成为人们生活中不可或缺的必备品,语音识别技术的市场需求将在未来几年显著增长。 语音指令在车载娱乐和导航系统中应用得越来越多。语音识别技术精确度的稳定提升也推动了这项技术采用率的提高。
语音识别技术并非一种技术,而是多种技术结合而成。通过将字、短语和句子记录下来并建立数据库,可以建立一个语音识别引擎。 然后就可以建立不同字的具体读音库。然后再将记录的文字与读音一一对应起来。 最后,就可以建立一个巨大的常用字语音库。
IBM和其他研究组织的科学家在过去几年里掌握了如何将他们的语音识别引擎更快地应用到具体人或环境的方法。 Nuance最新发布的Dragon Naturally Speaking 10 PC语音识别软件的翻译准确率可以达到99%。
Nuance是语音识别业界的领先者。预计它今年的全年销售额将达到9亿美元。 公司移动语音与消费者服务分公司总裁Steve Chambers表示,借助于这些丰富的经验,公司可以从使用不同的语言和口音的人那里收集大量语音样品,这有助于公司快速完善其技术。
除了Nuance之外,IBM研究公司也一直在努力开发高效的语音识别软件。Vlingo将IBM的技术与Nuance和其他厂商的技术进行了对比。 Vlingo首席执行官Dave Grannan称,IBM在中将语音处理与准确度很好地结合在一起。他并不担心IBM有一天会进入他的公司所在的市场。 另一方面,Nuance也与Vlingo是竞争对手的关系。他说:“由于IBM研究公司并不是IBM旗下直接与市场相关的公司,他们不用考虑市场竞争的问题。”
Nahamoo的团队正在集中精力寻找商业机会。但是IBM的研究人员也在探索社会影响巨大的市场领域。以印度的科学家为首的许多科学家正在进行一项名为“说话的网络”的计划,如果成功的话,语音识别技术将有助于向全球数亿文盲开放。IBM研究公司的通信业务高管Paul Bloom说:“语音识别技术有可能会改变那些未开化地区的面貌。”