0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是无声语音接口?

SSDFans 来源:SSDFans 2023-04-28 10:16 次阅读

可穿戴设备依赖于具有标准物理能力的人机界面,如语音、触摸或运动。虽然这种形式的机器交互适用于大多数消费者,但残疾人可能很难或无法操作标准的可穿戴设备。为了使更多人能够使用可穿戴设备,研究人员正在研究新的人机界面。

最近,康奈尔大学的一个团队发表了一篇论文,描述了一副为不能发声的用户配备了无声语音接口(SSI)的智能眼镜。本文将讨论无声语音接口和来自康奈尔大学的可穿戴原型。

什么是无声语音接口?

无声语音接口(Silent speech interface,简称SSI)允许人们无需发声就能与机器互动。虽然AI助手(如苹果的Siri)等技术是通过声音交流工作的,但SSI通过与语音相关的动作来完成交流。

SSI技术通过嘴巴和舌头的运动而不是声音来识别语音。为了做到这一点,SSI依赖于各种不同的传感器,包括放置在嘴巴附近的振动传感器,用于检测人们嘴巴的振动,以及跟踪和分类与语音相关运动的摄像头。在许多情况下,这些信息会被机器学习算法处理,该算法会解释嘴巴的动作,并将其翻译成文字。

虽然大多数人可能找不到SSI的用途,但这项技术对于因疾病或受伤而失声的人来说是必不可少的,可以让他们更容易地交流。例如,患有声带损伤或影响语言的神经系统疾病的患者可以从SSI中获益良多。

康奈尔大学开发无摄像头SSI眼镜

最近,康奈尔大学的研究人员在SSI技术方面取得了重大进展,发明了基于SSI的智能眼镜。

该系统被称为EchoSpeech,是一种新颖的、侵入性最小的SSI技术,它使用低功率有源声学传感来捕捉由无声语音引起的细微皮肤变形,并将这些信息转换为可操作的数据。这款智能眼镜的原型建立在康奈尔大学之前对一种类似的声学传感可穿戴设备(“EarIO”)的研究基础上,EarIO可以从耳朵内追踪面部运动。

cf967ebe-e4fb-11ed-ab56-dac502259ad0.png

该系统依靠安装在眼镜框架上的一系列扬声器和麦克风向皮肤发射听不见的声波。发出的声波产生沿多条路径传播的回声,并被系统解释推断为佩戴者的无声语音。EchoSpeech完全可以在标准的智能手机上运行,只需要1到6分钟的训练数据,并以73.3 mW的低功耗实时运行。该团队的深度学习算法可以实时分析回声,准确率约为95%。

该系统通过12名用户研究进行了评估,成功展示了识别31个独立命令和三到六位连接数字的能力,单词错误率(WER)分别为4.5%(标准3.5%)和6.1%(标准4.2%)。此外,在行走和噪声注入等场景中测试了系统的鲁棒性。

更私密、低功耗、易使用

大多数SSI技术使用面部摄像头,从用户和与其交流的人那里收集数据。除了造成隐私问题外,可穿戴摄像头还会收集高带宽视频数据。

由于EchoSpeech不需要可穿戴摄像机,设备只捕捉音频数据,这比图像或视频数据需要的带宽要少得多,并且可以通过蓝牙实时发送到手机。隐私信息永远不会脱离用户的控制,因为数据是在智能手机上本地处理的(不用在云中处理)。研究人员表示,纯音频传感器的电池效率也更高:音频传感器可以工作10个小时,而摄像头只能工作30分钟。

康奈尔大学的研究小组表示,他们发现EchoSpeech在很多应用中都有应用价值,从默念密码来解锁智能手机,到跳过播放列表中的歌曲。该设备还可以与智能手机配对,在说话不方便的地方与他人交谈,比如嘈杂的餐厅或安静的图书馆。研究人员表示,该界面与手写笔和CAD等设计软件兼容,从而消除了对鼠标和键盘的需求。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人机界面
    +关注

    关注

    5

    文章

    526

    浏览量

    44129
  • SSI
    SSI
    +关注

    关注

    0

    文章

    38

    浏览量

    19242
  • 可穿戴设备
    +关注

    关注

    55

    文章

    3813

    浏览量

    166997

原文标题:什么?无声语音接口?

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    想在ARM中把TVL320的编码解出来,判断有无声音输入?

    我想通过软件,判断有没有声音输入。 我想在ARM中把TVL320的编码解出来,判断有无声音输入。
    发表于 11-08 06:59

    omap4460开发板录音后播放无声音是怎么回事?

    最近想调试一下omap4460的声卡,发现omap4460可以播放声音却录音以后播放无声音?有么有搞过这块的大神,能给些指点!非常感谢!
    发表于 11-05 07:27

    TLV320AIC33更换后数字mic无声音是怎么回事?

    请问原本pcba上的TLV320AIC33发生不良后,重新更换新的TLV320AIC33后数字mic无声音? 电压供电都正常,是否需要重新code编译? 怎样才能数字MIC正常工作?需要烧录软件吗?
    发表于 10-29 07:57

    功放SR5200中置音箱无声音是什么原因?怎么解决?

    请教各位高手,马兰士功放SR5200,以前是在数字播放模式下选择PRO LOGIC播放时,环绕有声音,主声道和中置无声音,模拟播放主声道有声音,按照网友的指导,更换了IC4391。现在数字播放
    发表于 10-29 07:37

    TMS320C6000 MCBSP转语音带音频处理器(VBAP)接口

    电子发烧友网站提供《TMS320C6000 MCBSP转语音带音频处理器(VBAP)接口.pdf》资料免费下载
    发表于 10-26 10:17 0次下载
    TMS320C6000 MCBSP转<b class='flag-5'>语音</b>带音频处理器(VBAP)<b class='flag-5'>接口</b>

    tas5711 EVM配置以后无声音输出是怎么回事?

    tas5711 EVM DEMO板按照文档配置以后无声音输出 麻烦帮忙分析, 谢谢 。 配置如下图: 硬件连接图如下:
    发表于 10-25 14:25

    TAS2552+AM4379为什么无声音输出?

    上开发的,直接编译会不成功,将相关的接口修改移植到3.12.10版本上后,编译OK,运行正常。 4、目前在调试声卡情况如下: A、 I2C控制正常,读,写寄存口信息正确; B、 GPIO使能管脚正确
    发表于 10-25 06:20

    请问PCM1795输出无声音是怎么解决?

    PCM1795输出无声问题,附件是原理图请帮忙看一下有什么问题
    发表于 10-16 06:59

    TLV320AIC23B-Q1无声音输出的原因?

    目前我们配置这个codec,无声音传输。 背景:codec做slave设备,使用I2S接口,采样频率48k,16bit,选择I2C配置 已经确认进入codec的I2S信号没有问题,引线外接一个
    发表于 10-09 08:00

    LM4916规格书中的BTL方案接后无声音输出,是什么问题呢?

    在应用lm4916产品提,规格书中的BTL方案接后无声音输出,是什么问题呢? 应用立体声输出,声音听起来有失真,请各高手指教,谢谢!!
    发表于 09-20 14:42

    LM4991 WSON封装手工搭建的电路,通电后扬声器无声音,为什么?

    LM4991 WSON封装,手工搭建的电路,5.2V供电,通电后,扬声器无声音。 测量2脚bypass有2.4V的电压,说明整个芯片已经开始工作,但就是没有声音。 不知道电路在什么地方出问题?相同的电路我换上SOIC封装的LM4991工作正常。
    发表于 08-27 06:32

    谷歌AI新突破:为无声视频智能配音

    近日,谷歌DeepMind团队公布了一项革命性的技术——利用AI为无声视频生成背景音乐的“video-to-audio”技术。这一技术的出现,不仅为视频创作领域带来了新的可能,也为观众带来了更加丰富的视听体验。
    的头像 发表于 06-21 10:50 483次阅读

    MCU配对简化了语音控制接口设计

    携手合作,为STM32微控制器的嵌入式语音识别创建了一个完整的软件、硬件和许可包,并使添加语音接口变得简单。 它还将使设计工程师能够在没有编程,数据科学和机器学习专业知识的情况下部署以人工智能(AI)为中心的边缘
    的头像 发表于 05-06 16:21 2100次阅读

    微软发布视频编辑新功能:自动消除无声片段

    用户只需要在Clipchamp工具栏中启用人工智能建议,软件即可自动扫描视频并识别其中的静音片段。用户可以选择单独或批量删除这些无声音节。
    的头像 发表于 04-19 14:42 657次阅读

    未来之声 | 人形机器人说话篇:无声

    随着一个个有关人形机器人的“核弹式”新闻的出现,机器人技术肉眼可见地快速发展。或许,与人们预想的“像人一样说话”不同,未来人形机器人说话方式是:无声
    的头像 发表于 04-13 08:00 269次阅读
    未来之声 | 人形机器人说话篇:<b class='flag-5'>无声</b>!