0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智能语音交互是怎么实现交互流程中的输入输出呢?

鼎酷IOT部落 来源:未知 作者:李倩 2018-03-13 15:49 次阅读

小爱同学是小米公司于2017年7月26日发布的收款人工智能AI)音箱的唤醒词及二次元人物形象。小爱同学一经推入市场便受万千宠爱,网络上关于小爱同学的使用体验各式各样,无不是在称赞,他们对小爱同学的功能、特点无不熟悉,但是你知道小爱同学是怎么工作的吗?

智能语音交互是人工智能的分支,相当于语音助手,属于一款智能型的手机应用,通过智能对话与即时问答的智能交互,实现帮助用户解决问题的功能。

说起智能语音助手大家首先想起的是哪些呢?

1. Siri

苹果iOS系统中的人工智能助手软件

2. Cortana

微软开发的全球第一款人工智能助手,中文名小娜,横跨手机与PC两大平台。

3. Alexa

亚马逊推出的语音助手,主要搭载在Amazon Fcho智能音箱上。

智能语音交互是怎么实现交互流程中的输入输出呢?

智能语音交互界面事实上包含了三个技术环节:

1. 语音识别(ASR)

将人类的语音中的词汇转换为计算机可读的输入,一般包括了信号处理,尽可能的降低环境噪声、信道、说话人等因素对特征造成的影响。用户根据系统设计的口令密码与系统进行沟通。

比如:小爱同学的操作执行,每次发出指令的模式必须是“小爱同学+工作任务”,小爱同学接收后在把语音转化成文字,再结合文字做出指令回复。

2. 语义处理(NLP)

自然语言的处理,就是把人的语言转化成机器能够理解的数字,分解开,并回复相应的语言。很多在购买智能音箱之后都会有觉得是“智障音箱”的主要原因就在这里,现在的技术条件下,只能做到固定的回答,无法像人类一样思考,再加上人类语言有大量的表达方式和歧义语句,理解错误的地方也非常多。语义处理的主要目的就是把人类语言与机器语言尽可能的相互接近,实现真正的用户正常对话。

3. 语音合成(TTS)

是通过机械的、电子的方法产生人造语音的技术,将计算机自己产生的、或外部输入的文字信息转变为乐意听得懂的、流利的汉语口语输出的技术,可以让机器人像人一样开口说话,小爱同学就是通过这项技术跟你交流的。

语音交互发展的优势

1. 解放双手、双眼、双腿,接触空间限制,远场可交互

2. 指向明确,语义直达目标,缩短使用路径

3. 自然简单人性化,学习门槛低

4. 可以一对一,也可以一对多

5. 对硬件的要求低

语音交互的劣势

1. 不适合用户选择多、流程长,需要大量辅助信息决策的交互任务

2. 远场语音交互对距离、噪音、混响、声源数量等有一定的要求

3. 不适用于公共场合,需要安静的尝试

4. 依赖嘴巴和耳朵,对语种、口音和发音有一定要求

5. 输出信息单一,表达能力有限

从技术和时间上来说,现在的智能语音交互系统还是存在一定缺陷和局限的,但是我们相信任何技术都是在实践中成长的,你们的小爱同学也会越来越惹人爱的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    29611

    浏览量

    267903
  • 人工智能
    +关注

    关注

    1789

    文章

    46544

    浏览量

    236819
  • 智能语音
    +关注

    关注

    10

    文章

    772

    浏览量

    48673

原文标题:智能语音交互:你知道小爱同学是怎么工作的吗?

文章出处:【微信号:dkiot888,微信公众号:鼎酷IOT部落】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【实操文档】在智能硬件的大模型语音交互流程接入RAG知识库

    本帖最后由 jf_40317719 于 2024-9-29 17:13 编辑 智能硬件的语音交互接入大模型后可以直接理解自然语言内容,但大模型作为一个语言模型,对专业领域知识的训练缺乏也是
    发表于 09-29 17:12

    车载导航人机语音交互系统的实现

    利用小词汇量的关键词识别引擎实现大词汇量POI名称的识别,并且获得了满意的识别正确率,但是耗时较长。结语本文主要完成了车载导航人机语音交互系统的设计和实现,并在实验室环境
    发表于 08-15 21:27

    【Gokit 3试用体验】通过Lark 7618模组实现语音交互+语音交互UI设计理念

    语言是人类交互最自然最舒适的方法,而今天,机智云Gokit 3上Lark7618智能语音识别模块提供了一个很好的外围音频实时采集电路,以及快速的音频合成输出系统,有这两样,加持Goki
    发表于 08-28 13:46

    智能音箱混战 远场语音交互只是开始

      导读:远场语音交互开始是智能音响,但是将来绝对不仅仅是智能音响,技术还会扩展到很多其他的产品。   7月5日,阿里推出了自己的首款消费级AI产品天猫精灵X1,同日百度也宣布了Du
    发表于 07-17 09:37

    请问labview动态调用子vi的输入输出怎么和主程序交互

    labview动态调用子vi,子vi的输入输出怎么和主程序交互
    发表于 01-16 20:17

    车载导航人机语音交互系统的设计和实现

    的设计,根据人机交互的需求,设计语音导航系统的硬件框架如图 1所示。语音导航系统和用户之间的人机交互接口由触摸屏、按钮、话筒、显示屏和扩音
    发表于 05-07 07:00

    树莓派语音交互如何实现开关灯?

    树莓派语音交互如何实现开关灯?
    发表于 11-08 07:08

    探析智能语音交互应用和技术

    北京声加科技CEO邱锋海受邀以《声加万物、聆听未来:智能语音交互应用和技术》为题,分享了目前正在爆发的智能语音
    的头像 发表于 11-23 09:54 4769次阅读

    什么是人机交互技术?

    计算机输入输出设备,以有效的方式实现人与计算机对话的技术。 人机交互系统的主要组成 1、多模态输入/
    的头像 发表于 11-02 15:14 1.8w次阅读

    智能交互终端的功能 智能交互终端怎么设置

    智能交互终端是指能够通过人机交互的方式,实现信息互动、控制操作等功能的设备。具体包括以下几个方面的功能:   1. 语音
    的头像 发表于 04-16 11:53 4148次阅读

    什么是智能交互终端功能

    家一起来看一下吧。 智能交互系统 智能交互系统是指通过计算机输入输出设备,以有效的方式
    发表于 06-15 14:04 720次阅读

    智能座舱的语音交互系统技术应用

    从用户发出语音指令到实现智能设备的交互,其过程并不像其名词描述的那么简单,要实现通过语音来完成
    发表于 07-28 10:17 531次阅读
    <b class='flag-5'>智能</b>座舱的<b class='flag-5'>语音</b><b class='flag-5'>交互</b>系统技术应用

    请问MCU是如何实现IO口的输入输出控制的?

    GPIO(General Port Input&Output)通用输入输出接口,MCU各个管脚对外交互最根本的单位。
    发表于 08-10 11:10 2844次阅读
    请问MCU是如何<b class='flag-5'>实现</b>IO口的<b class='flag-5'>输入输出</b>控制的?

    情感语音识别技术在人机交互的应用与挑战

     一、引言 随着人工智能技术的不断发展,人机交互已经成为了研究的热点之一。情感语音识别技术作为人机交互的重要组成部分,能够通过识别人的
    的头像 发表于 11-09 15:27 765次阅读

    智能语音交互技术如何助力设备实现人机自然对话

    智能语音交互技术是指通过语音识别、语音合成和自然语言理解等技术,实现人与机器之间自然语言的交流和
    的头像 发表于 05-23 15:14 336次阅读