|
通过使用声讯信号技术,Sendo X 可以使扬声器不受限制地拨叫Symbian智能手机。本文中,SymbianOne对声讯信号技术进行了剖析,并探究了其如何在智能手机上进行声讯控制。
因为在Sendo X上使用了扬声器独立声讯拨号解决方案,声讯信号获得了2个里程碑式的成就。这是第一次在Symbian系统上采用声讯信号技术,同时这也是欧洲市场上第一次在手机上采用该技术。那么为什么要将声讯信号技术引入Symbian操作系统呢?
于1995年马塞诸萨州波士顿成立的,拥有约50名员工的声讯信号公司从一开始就为所有的嵌入式系统应用程序提供扬声器独立声讯确认解决方案。在90年代后期,声讯信号公司开始为移动电话市场创建解决方案,并且从2000年开始,集中力量关注移动电话应用程序。
围绕PC机或服务器应用程序的各式各样的语音识别方案有很多类型,在无线设备上应用相关技术始于90年后期。然而目前的无线语音识别解决方案是扬声器依赖。电话的主人需要需要训练程序以识别它们所要沟通的联系人,并且通常来说,联系人的类型限制在20个左右的名字内。查尔斯说:“因为训练识别语音程序所造成的附加步骤确实正在消散你的普通用户群。并且当你拥有一个类似于Symbian操作系统电话上的电话簿时,你会发现这个电话簿很有效率并且在容量上没有限制,相对来说,传统的扬声器拨号却成了一个不使用的特性。”
声讯信号的解决方案是一种语音基准系统,其不需要对语音程序进行训练并且可与电话通讯数据库中保存的任意语音记录相匹配。同时要指出的是,这个电话通讯数据库的存储容量并不受限制。这个技术目前已经成功地集成在三星公司和摩托罗拉公司投放在北美和亚洲市场的手机上。
语音识别技术通常使用三种技术,隐藏蒙特卡洛模式(HMM),动态时间包裹(DTW)和神经网络。声讯信号公司的解决方案是基于HMM的,这是一个统计学模型,其本质原理就是预测两个序列是否相匹配。HMM被用于多种标准中,由于应用程序与可导致国际化危机可能性的确定量一样变化很多,从而其可进行面部表情的识别。
HMM通过使用约10微妙的语音采样块来工作,每个采样都由其包含的频率所定性。随后频率的类型就与数据库中那些构成声音的基本声元之音素相匹配,音素列表可以与能确定一个人说话类型的多样化单词音素模型相比较,一旦音素与之相同,即可被匹配。
而声讯信号的解决方案在本质上是如此的相似与 你可在发现的基于PC机或者服务器上HMM执行方案,查尔斯说:“这是一种艺术级的算法,我们所看到的声讯信号所做的一切与如何确定一部引擎规模更小,运行更快一样。”
查尔斯认为当Sendo与声讯信号两家公司的商讨开始时,声讯信号公司提供的扬声器独立识别技术会使Sendo惊喜。当Sendo X 工程体现两家公司的合作时, Sendo将声讯信号公司的技术送入市场将是一种非常好的模式。
在Sendo X 上实现的解决方案包括三个部件,用户界面,语音识别引擎和一个可重复确认名字的文本语音引擎(TTS)。查尔斯解释说:“既然用户无需再训练设备识别语音,我们意识到他们也需要某种程度的回馈用来确定它们拥有的联系目录是正确的。”
声讯信号识别与文本语音引擎都是用C语言构建的,并且两者都是为移动设备而专门开发的,所以Symian操作系统上为Sendo X做的开发方案不是声讯信号公司仓促开发的结果。事实上,查尔斯指出声讯信号的工程师认为Symbian操作系统非常便于开发。“这是一个伟大的开发环境,能使我们迅速的进入市场,拥有好的工具及一个活力充沛的开发支持网络。”查尔斯说。从商业角度看,查尔斯认为Symian家族资源丰富并且对第三方开发很友好。
查尔斯说:“我们对Symbian平台和Sendo X感到很兴奋,两者对我们来说是一个很好的机遇。”虽然查尔斯并没有揭示声讯信号公司未来发展路标的根本,即基于Symbian的产品,但他评论道“作为一个公司,我们对Symbian系统的支持是不断增长的并且我相信下个月你会看到相当数量相关产品的发布宣告。”
从长期角度说,第三方开发商可能对声讯信号公司对其技术的开发感兴趣,如此该技术便可以被应用在第三方应用程序中。然而查尔斯指出开放的前提是声讯信号公司已经建立起一个广泛的市场并且能获得至少一到两年关于该技术可用性的好评。同时还有一个观点就是声讯信号公司需要一个新的架构来支持第三方开发商。查尔斯说:“在近期来说,我们关注的是我们技术是我们技术能在多大范围能帮助用户执行相关任务而不是拨叫。举个例子来说,我们正在研究当每个任务的用户接口都受限制时,如何可使该技术能更轻易地发送,接受及创建信息,获得数据服务。本质上,我们希望能后调整这项技术,使之可适用于混合用户经验模式并且这也是我们现在所要做地主要工作。”
你可以在声讯信号的网站www.voicesignal.com看到更多关于声讯信号的内容,在Sendo的网站www.sendo.com看到更多关于Sendo X的相关内容。
此文为开发视界翻译转载者请注明出处否则追究法律责任
|