广告位API接口通信错误,查看德得广告获取帮助

时尚汽车_汽车生活移动版

主页 > 行业 >

科大讯飞钱勇:车载语音交互技术助力智能汽车强势发展(2)

今天我主要想跟大家分享一下人机交互域的问题,人机交互在前一个阶段家行业里面通力合作情况下,已经取得了比较好的进步,但是仍然会存在一些问题,我们大概总结一下,分为几个方面,第一个方面就是人机交互的方式,现在人机交互的方式虽然已经引入了语音,但是仍然会存在这种机械感比较强的感觉。第二,这种交互的方式比较单一,语音就是语音,图像交互就是视觉交互。第三个就是车内多人交互会相互干扰。第二个板块,其实我们看到内容服务这一块,内容服务的生态的割裂以及APP化对用户的体验非常大,影响非常大。然后还有一点就是汽车场景单独的服务的创新其实是非常难的。一般的团队或者小的团队是很难在这个方向做创新发展的。第三个就是整车,虽然智能化的部件越来越多,但是整体上来看的话,整车的智能化部件还是相对较少,这些部件之间的接口不标准,部件之间的融合智能化的融合,其实难度非常的大。所以基于这样的现状,我们一直在考虑下一代的人机交互域的解决方案是什么样子的,我们提出咱们的系统整体解决方案,解决方案重点我们解决三个问题,第一个是智能交互,交互升级,让我们要塑造一个有温度,有情感的人工智能的助理。第二个就是服务的升级,去APP化实现让服务找人。第三个就是整车融合,让整车上的智能的设备能融合一体,提升整车的智能化的交互体验效果。

首先我们看第一个部分,就是智能交互的发展,汽车上的人机交互方式,从最早的按键式的交互到后面的触摸屏式的交互,再到现在的语音交互,在语音交互里面又分为三个阶段。第一个阶段我们可以看到像命令词的交互,第二个是现在我们在推的自然语言是的交互。到第三个阶段,多轮交互将会成为主流,在智能交互里面,我们重点会推三大升级,这三大特性分别是什么?第一是多模态交互,第二是多乘客交互,第三是情感化交互,多模态交互,大家可以理解,最早的是按键式交互到触屏式交互,以触屏为主的交互,以及我们以推动了语音为主的交互,其实在上个阶段融合花费了很长的时间,再往后面会融入视觉交互和声纹交互,这些感知层面的融合,其实在认知层面需要一个运算大脑的融合,最后在我们的呈现层面,在不同的平台执行机构上进行展现。

第二个是多乘客交互。随着智能驾舱以及智能移动出行的普及和发展,多乘客交互在车上会越来越实现,多乘客在车上能够获取自己个性化的服务,是未来我们看到的一重要市场的趋势方向。大家有看到过未来的车上面已经能够实现不同的驾驶位,通过语音交互能够获取不同的服务,坐在主驾驶的发出指令,帮我打开天窗,打开的一定就是主驾驶位的天窗。所以这里面依赖于我们首发的一款技术,多音区方案是基于科大讯飞最早的麦克风阵列技术,对车上的一位置进行区分,然后结合声纹技术,让每个客户每个乘客能够享受到它个性化的服务。

第三情感化交互。现在很多人托我通过语音交互跟我们的汽车交互。还是有冷冰冰的这种汽车的感觉,所以我们会融合VR技术,为每一个汽车打造每一个汽车用户,打造一个专属自己的虚拟人工助理。第二个板块就是智能服务,智能服务这一块,其实我们面临的要去解决的就是去APP化以及实现服务找人,最早的现在我们的交互方式都是让人去找服务,其实在这个阶段要让服务找人和人找服务,这两种模式都能够融汇在一起。

简单看一下去APP化的体验,核心在于云端的融合,在于账户的打通,在于数据的融合。有一个很简单的场景,比如说我们早上去跑步,我在听一首音乐或者听一个书,当我在上车的时候,我的场景应该自动能够从移动端转移到我的车端,要实现这样的体验,就必须打破原来APP的限制,能够让云端的数据和账户能够融会贯通。目前我们的积极努力,我们跟高德地图,QQ音乐,喜马拉雅,美团,这些大的IP已经能够实现账户的通,然后让大家实现场景的转移,然后实现服务找人。服务找人其实是一个非常苦非常累的活,他的核心的原理是在于基于用户的数据支数据的分析的基础上,把用户的在汽车领域的使用场景进行细分。细分到你在每一个细分场景下,你可能出去线的这样的诉求,然后让服务主动通过主动交互的方式,让服务触达的我们的用户,这个是需要慢慢去细分场景的,然后最核心的一个是我们叫智能场景的模型。

(责任编辑:admin)
广告位API接口通信错误,查看德得广告获取帮助