随着CarPlay、Android Auto和Echo Auto等平台逐渐渗透乘用车市场,车内语音识别技术有望成为主流。然而,一个悬而未决的问题是:市场上的语音启动技术是否已经准备好应对驾驶过程中的关键任务?
在今年1月的国际消费电子展(CES)上,高通展示了其车内Smart Audio平台上的Amazon Alexa语音识别功能,这一展示引发了人们对未来发展的诸多遐想。高通的演示表明,车内虚拟助手将使语音成为驾驶员与车辆之间更自然的交互界面。
在高通的演示中,Alexa在某位高管讲话时突然插话,说:“不对!这不是真的。”尽管这种小失误在演示中难以避免,但这也反映出当前商用语音处理系统的局限性。语音识别系统在嘈杂环境中往往表现不佳,车内环境尤其如此。以色列初创公司Hi Auto的首席执行官兼联合创始人Roy Baharav在接受EE Times采访时指出,车内噪声问题复杂多变,包括后排乘客的喧哗、救护车的警笛声和雨滴敲击车顶的声音。
为了消除噪声并提高车内语音识别的可靠性,Hi Auto开发了一种集成了面向驾驶员摄像头和单个麦克风的视觉语音处理方案。该系统利用深度学习算法追踪唇部动作,锁定驾驶员的声音,同时过滤掉其他噪音源。Hi Auto声称,这种方法能够实现更准确的语音识别和清晰的对话。该公司计划推出一款“纯软件”解决方案,无需特定硬件支持。
车内语音识别
语音输入有望成为最终的交互界面,但目前它仍然处于发展阶段。许多人对与无生命物体对话感到不自在,因此培养用户习惯在车内使用语音控制系统是一项挑战。Hi Auto的成功依赖于语音控制的普及程度,尤其是在汽车行业。据Baharav介绍,许多高端车型已广泛采用语音控制技术,且这种趋势正逐步向大众市场渗透。语音控制系统不仅提升了用户体验,还被视为提升驾驶安全性的重要手段。
Baharav进一步解释,传统的触摸屏操作已成为驾驶员分心的一个原因,而日益严格的汽车安全法规也推动了语音控制技术的发展。此外,越来越多的消费者习惯了在家中使用Amazon Echo或Google Home等设备,也希望在车上获得类似的体验。
根据市场研究机构Voicebot.ai的数据,2019年有60%的美国消费者在购车时会考虑配备语音助理系统的车辆。
除了Hi Auto,市场上还有其他看好“会说话的汽车”概念的公司。例如,从Nuance独立出来的Cerence公司年收入已达3亿美元,另一家公司SoundHound也在积极扩展市场份额。预计到2025年,通过语音助理产生的商业和广告支出将达到200亿美元,其中汽车行业将是重要的贡献者之一。
语音控制能否应用于关键任务?
语音控制最直接的应用是车载信息娱乐系统的交互界面,驾驶员可以通过语音命令拨打电话、发送短信、播放音乐或导航。但除了这些基本功能外,还有哪些理由需要与车辆进行语音交流呢?
Baharav认为,共享汽车和家庭用车场景中,车内信息娱乐系统的需求更为复杂。当有多名乘客同时发出多个语音指令时,高质量的车内语音技术显得尤为重要。随着高级驾驶辅助系统(ADAS)功能的不断增加,未来的驾驶者可能能够通过语音指令控制车道变换、超车或停车等操作,这些功能的可靠性和抗噪性能将受到关注。
推动这一创新的主要动力来自于汽车制造商对数字化体验的追求。他们希望消费者更多地使用自家的车载信息娱乐系统(IVI),而不是苹果的CarPlay或谷歌的Android Auto。Baharav指出,汽车制造商将致力于提供用户友好的IVI系统,支持流行的音乐流媒体、数字广播和实时通信应用程序。同时,他们还将IVI系统与自家开发的地图软件、广播、通话/短信支持、车身控制以及ADAS互动等功能集成,以增强用户体验。
然而,当前的语音助理解决方案在嘈杂环境中仍存在不足。例如,一位父亲驾车带女儿和她的朋友去踢足球训练,发现油箱里的汽油快用完了。他不想花时间在高速公路上寻找加油站,但车内噪音太大,导致语音指令无法被准确识别。类似的情况还包括在雷雨天气中驾驶,背景噪音复杂,现有的语音识别技术难以应对。
Hi Auto近期完成了450万美元的种子轮融资,由以色列汽车出口商Delek Motors及其现任董事长Zohar Zisapel领投。该公司计划利用这笔资金开发首款产品,并进行市场推广和团队扩张。预计在2020年底,Hi Auto的技术将接受行业领先厂商的测试。在2020年的CES展会上,Hi Auto将通过软件开发工具包(SDK)的形式推出车内语音处理方案,提供简单授权或云API服务。