0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

思必驰积淀许久的one-shot功能也终于揭开神秘面纱

思必驰 来源:djl 作者:思必驰 2019-08-06 11:55 次阅读

人工智能的热潮驱动了整个行业的发展,智能语音作为最天然的交互手段,自然备受关注。在语音交互引起传统交互变革的今天,智能车载领域成为了变革的先锋,尤其是后装市场,智能语音似乎已经成为了车载场景交互的标配。

国内专注智能语音的企业竞争越来越胶着。阿里,语音客服俨然已成为刚需;百度,强大的搜索资源库成为了百度语音的后备力量;科大讯飞,依托政府项目,在教育、医疗、智慧城市等领域也占据着市场优势;乐视推出乐乐语音,改变着乐视超级电视的交互方式;爱奇艺、360、等也都在纷纷涉足语音技术。专业的语音公司更是凭借着特色的解决方案,风头正盛。在这其中,交互方式的简单便捷,成为几乎所有语音交互方案追求的一大效果。

讲到语音交互的简单与便捷,思必驰于2016年10月20日升级版的AIO3.1新增的one-shot功能吸引了行业极大的关注。AIOS For Car是思必驰于2015年10月针对智能车载后装市场推出的一款对话操作系统,主要应用在车机、智能后视镜、HUD,以及互联网汽车等产品上。2016年6月,思必驰将其升级至AIOS3.0版本,新增7大功能, 10月20日,思必驰再次发力,升级至AIOS3.1版本,积淀许久的one-shot功能也终于揭开神秘面纱。

one-shot一语即达

思必驰将one-shot功能描述为“一把说”,这一描述也十分的生动形象,贴近实际。

图1 思必驰one-shot一把说

one-shot一把说,采用“唤醒词+语音语义识别”一体化方式,实现唤醒词与语音操控之间零间隔、零延迟、无缝对接,摒弃传统的一问一答的形式,极大减少用户语音操控的步骤,实现信息反馈,化繁为简,实现简便操作,但这样的简便在设计之初却并不简单。

one-shot的一大特点是识别唤醒与语义理解一体化,保证语音交互的统一性与连贯性,完成操控。举个简单的例子来讲,过去智能语音的交互方式为一问一答,用户发出唤醒词指令,需要设备反馈待机信息,然后才能开始交互,例如:

用户:你好小驰(唤醒词指令)

设备:有什么可以帮您?(设备反馈,表示处于信息接收状态)

用户:我要去机场

设备:开始为您导航去机场

one-shot功能却可以一语即中,实现“唤醒词+语音语义识别”一体化,比如实现这样的交互:

用户:你好小驰,我要去机场

设备:开始为您导航去机场

相比传统,这样的体验似乎更具效率。或许未来,在人机交互中,机器通过采集用户的行为习惯数据,追踪用户意图,实现如下的对话,也并非不可能:

甲:我一直有个问题想问你

乙:爱过….

系统响应速度及精准度始终是用户关心的一大问题。AIOS3.1中的one-shot功能采用本地+云端混合引擎模式。语音唤醒和常用的语音指令识别存储在本地,系统接收反应灵敏,语音识别能够准确及时的响应。与此同时,连续语音识别和语义理解进行云端处理,基于场景,收集用户习惯数据,通过深度学习,分析并追踪用户意图,保证语义理解精准性。本地加云端的混合引擎处理,既保证了响应速度也确保了交互的精准,即使在没有网络的情况下,依然可以使用基本语音交互功能。

GUI图形交互界面必然会继续前进变革,VUI语音交互界面是一大发展趋势。思必驰one-shot功能的发布,展示了其在VUI产品交互设计的深度思考。相信,通过不断的提升语音交互体验,VUI必然会在未来IOT行业的人机交互中引起越来越多的变革。

用技术说话:研发实力是关键

很多车载后装产品用户反映一个问题,就是使用车载语音时,说“我要去天安门”,系统可以响应,但是说“去天安门”时,系统无反应,这是为什么呢?实际上,这是因为一些语音方案商将“我要去”三个字固化为唤醒词,而“去”、“我想去”这类词与“我要去”不完全匹配,所以系统自然无法识别。这种交互方式,表面上被宣传为“免唤醒”,实际上恰恰相反,系统通过采用大量唤醒词来实现,这样做导致误唤醒率极高、增加系统资源占用、可扩展性差,同时强迫用户记忆,为用户的安全驾驶带来隐患。

就此问题,思必驰产品总监雷雄国表示“思必驰用one-shot功能来解决这一问题,用户想怎么说系统都可以理解,基于对应用场景的深度学习,系统能够通过后台用户数据采集,分析用户行为习惯,准确追踪用户意图,克服刻板的关键词识别,通过大词汇数据,实现场景的流畅交互”。

实然,语音技术企业的核心竞争力在语音技术研发实力、产品化落地及市场应用着陆,成为企业生存之道。一些企业坚持自主研发,一些企业善于使用国际开源工具,比如,Google开源深度学习系统Tensor Flow。该系统支持支持CNN、RNN和LSTM算法等流行的深度神经网络模型,大大降低深度学习的应用难度,提升开发速度。但通用的开源工具有其效率和权限上的局限性,既无法满足特定的前沿算法需求,也常常无法满足用户基于场景的个性化需求,不同专业领域的算法、数据、架构等都要依托实际应用进行搭建及优化。

目前国内智能语音行业中,深耕技术研发的企业并不多,比如在深度学习方面,百度研究院推出Deep Speech系统,科大讯飞推出FSMNN算法模型,思必驰与上海交大联合实验室则独立拥有VDCNN算法模型和PSD解码架构。拥有独立自主研发实力,才能结合产品特性、应用场景,深度定制交互方案。

图2 思必驰one-shot一语即达

无论是新奇的one-shot功能,还是说传统的语音交互,在人工智能时代,只有技术落地转化为良好的产品体验才能更好的绘出未来智能生活的景象,我们期待着更多新技术的发布,也期待着新技术给我们带来的惊喜。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    47131

    浏览量

    238113
  • 智能车载
    +关注

    关注

    0

    文章

    54

    浏览量

    9083
  • 语音交互
    +关注

    关注

    3

    文章

    286

    浏览量

    27999
收藏 人收藏

    评论

    相关推荐

    [分享]揭开zzz 手机神秘面纱

    揭开zzz 手机神秘面纱zzz 手机的基础模型可与诺基亚的 N95 相媲美,欧美的客户都为该手机奇妙的个性化功能兴奋不已。个性化手机从外壳的颜色到硬件的配置都可由客户自行设定,甚至会在
    发表于 05-31 09:25

    【AWorks试用体验】+揭开AWorks神秘面纱(开箱贴)

    按耐不住激动的心情,轻轻放平快递包裹,开始欣赏AWorks,且看仔细分解。原始未开封的AWorks包装,接下来让我一层层地拨开她,揭开神秘面纱。打开外层,映入眼帘的是AWorks的外包装盒,标示很
    发表于 08-19 15:22

    【MiCOKit试用体验】开箱——千唤万呼始出来, 神秘面纱终于揭开

    ` 本帖最后由 DXK123~ 于 2015-9-16 11:07 编辑 开箱——千唤万呼始出来,神秘面纱终于揭开收到板子已经几天了,遇上了一年一季的数学建模大赛,楼主跟上小学弟
    发表于 09-16 10:18

    请问采样保持芯片AD783的ONE-SHOT是什么电路

    您好! 有俩个问题请教!附件里是AD783的Datasheet里推荐的一个采样电路。我的问题是:1.这个电路里的ONE-SHOT 是什么电路, 2.那个触发器使用的是什么型号的触发器呢? 谢谢了!附件AD783.png48.8 KB
    发表于 12-03 09:19

    揭开深记忆示波器的神秘面纱

    揭开深记忆示波器的神秘面纱
    发表于 09-23 07:56

    如何使用的方案做语音识别功能并且不影响普通的麦克风录音功能

    如何使用的方案做语音识别功能并且不影响普通的麦克风录音功能
    发表于 03-04 06:46

    苹果iPhone手机神秘面纱揭开

    苹果iPhone手机神秘面纱揭开       据国外媒体报道,日前,BoyGeniusReport网站公布了号称是下一代iPhone手机所用背盖的照
    发表于 04-17 16:22 516次阅读

    揭开vivo APEX全面屏的神秘面纱

    vivo 官方终于向外界揭开了24日预告的 APEX 全面屏概念机的神秘面纱。我们可以用一个词来形容:惊艳。如果一个词不够用,那我们再加一个词:黑科技满满。
    发表于 03-21 10:12 2138次阅读

    Duskers - 揭开科幻生存游戏中的神秘面纱

    飞行员无人驾驶太空船,找到生存的手段,揭开宇宙如何成为这个科幻生存游戏中的巨大墓地的神秘面纱
    的头像 发表于 11-08 06:37 3101次阅读

    一个单路径One-Shot模型,以解决训练过程中面对的主要挑战

    One-Shot 是一种新范式。它定义了超网络,并以相似的方式做权重复用。但是并没有将模型结构分布参数化。模型搜索从超网络训练中解耦,并且解决步骤是独立的。因此,One-Shot 具有序列性。它结合了上述嵌套式和联合式优化方法的优点,因此灵活而高效。
    的头像 发表于 04-04 16:46 4240次阅读
    一个单路径<b class='flag-5'>One-Shot</b>模型,以解决训练过程中面对的主要挑战

    “声象”揭开神秘面纱

    语音输入板,展示云端的大段连续语音转文字的技术,实时转录,识别率高达96%;多轮对话,功能升级的“小”将更加能说回到,体贴知心;语音世界,实时对录入声音进行合成化处理,模仿林志玲、郭德纲、葛优、童声、标准男女声等声音;语音活动导览,讲述参展企业的品牌历程。
    的头像 发表于 08-06 09:57 2494次阅读

    揭开数字健康应用的AI和机器学习的神秘面纱

    在本文中,我们将仔细研究用于处理生理信号的算法的整体架构,并揭开其操作的神秘面纱
    的头像 发表于 12-01 15:17 628次阅读

    揭开快充芯片的神秘面纱

    UFP芯片是一种用于USB快充技术的关键元件,它在移动设备和充电器之间进行通信和协调,以实现高效、安全、快速的充电过程。下面我们将揭开快充芯片的神秘面纱,深入探讨UFP快充芯片的工作原理和功能
    的头像 发表于 04-15 12:51 603次阅读

    用智能DAC揭开医疗报警设计的神秘面纱

    电子发烧友网站提供《用智能DAC揭开医疗报警设计的神秘面纱.pdf》资料免费下载
    发表于 09-14 10:50 0次下载
    用智能DAC<b class='flag-5'>揭开</b>医疗报警设计的<b class='flag-5'>神秘</b><b class='flag-5'>面纱</b>

    AI办公本Turbo重磅发布

    近日,AI办公本新品发布会如约而至,IOT事业部首席产品官马斌斌详细介绍了
    的头像 发表于 10-31 14:23 403次阅读