0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

失语者的未来:无声语音的数字发声

ss 来源:陈述根本 作者:陈根 2020-11-30 15:26 次阅读

人工智能技术的精进与开发无疑对人工智能的应用至关重要,而人工智能除了在与生活强关联方面的应用,回应少数群体的需求也将成为人工智能发展的必然方向。

近日,加州大学伯克利分校的研究人员表示,他们正在使用无声语言和收集肌肉活动的传感器来训练人工智能。其中,无声语言是用肌电图(EMG)检测的,电极则放在脸和喉咙上。研究人员表示,该模型的重点是研究被称之为“沉默语音”的模型,该模型可以检测到人们想说、但没说出声的话。

研究人员相信,他们的方法可以为那些无法发出声音的人提供大量的应用,并且可以支持人工智能助手或其他对语音命令做出响应的设备进行沉默语音检测。

尽管设想美好,但想真正实现却并不容易:首先,在收集数据时,研究者会先在实验者的脸上等部位贴8个贴片,每个贴片都是一个“监视肌肉变化”的传感器。

随后,研究人员需要录制一段实验者的有声语音,并与肌电图进行对应这种方法能够将肌肉的变化情况、和语音的类型对应起来。然后使用WaveNet解码器生成音频语音预测。在记录数据的过程中,还要再录制一段“对口型”的肌电图,但不需要发声,也就是“沉默语音”。

与用发声肌电数据训练的基线相比,该方法在书中句子转录的单词错误率下降了64%到4%,错误率比基线减少了95%。此外,为了推动这一领域的进一步研究,研究人员还开发了一个由近20小时面部肌电数据组成的数据集。

这项题为“无声语音的数字发声”的研究论文,在近日举行的自然语言处理经验方法(EMNLP)活动上,获得了最佳论文奖。

研究小组的论文写道:“数字化无声语音有着广泛的潜在应用。”例如,它可以用来制造一种类似于蓝牙耳机的设备,它允许人们在不干扰周围人的情况下进行电话交谈。而显然,这种设备在环境噪音太大无法捕捉到可听语音或保持沉默的环境中将具有重要作用。

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能
    +关注

    关注

    8

    文章

    1709

    浏览量

    117490
  • AI
    AI
    +关注

    关注

    87

    文章

    30757

    浏览量

    268902
  • 数字化
    +关注

    关注

    8

    文章

    8712

    浏览量

    61730
收藏 人收藏

    评论

    相关推荐

    想在ARM中把TVL320的编码解出来,判断有无声音输入?

    我想通过软件,判断有没有声音输入。 我想在ARM中把TVL320的编码解出来,判断有无声音输入。
    发表于 11-08 06:59

    PCM1794数字模拟分开供电,二地通过一个磁珠连接,pcm1794有轻微发热正常吗?

    PCM1794数字模拟分开供电,二地通过一个磁珠连接。后边使用官方滤波电路,刚开始工作正常,但是pcm1794有轻微发热,正常吗?另外工作一段时间后(大概十几分钟,有时候半个小时)就不能发声
    发表于 11-05 07:23

    TLV320AIC33更换后数字mic无声音是怎么回事?

    请问原本pcba上的TLV320AIC33发生不良后,重新更换新的TLV320AIC33后数字mic无声音? 电压供电都正常,是否需要重新code编译? 怎样才能数字MIC正常工作?需要烧录软件吗?
    发表于 10-29 07:57

    功放SR5200中置音箱无声音是什么原因?怎么解决?

    请教各位高手,马兰士功放SR5200,以前是在数字播放模式下选择PRO LOGIC播放时,环绕有声音,主声道和中置无声音,模拟播放主声道有声音,按照网友的指导,更换了IC4391。现在数字播放
    发表于 10-29 07:37

    请问PCM1795输出无声音是怎么解决?

    PCM1795输出无声问题,附件是原理图请帮忙看一下有什么问题
    发表于 10-16 06:59

    在仿真放大器时,如何让speaker发声呢?

    在仿真放大器时,发现TINA-TI Speaker 无声?如何让speaker发声呢?
    发表于 10-10 08:29

    九芯电子革新健康检测!语音播报血压计ic芯片解决方案

    血压计,可测量血压并将读数显示在屏幕上。为了提高老年人和视障人士的可用性,现代电子语音血压计已经开发出来,可提供当前血压读数的听觉反馈。这是通过集成语音芯片来实现的,该芯片将测量结果发声给用户
    的头像 发表于 09-22 08:00 213次阅读
    九芯电子革新健康检测!<b class='flag-5'>语音</b>播报血压计ic芯片解决方案

    早教有声挂图画能够发声的工作原理

    有声挂图通常分为单语、双语、多语,单面、双面,以及凹凸和平面之分。至于它能够发声主要依赖于内部的语音芯片,这些芯片能够响应小孩子的触摸操作,触发特定的声音播放。通过精心设计的图案和对应的发声位置
    的头像 发表于 08-30 12:05 387次阅读
    早教有声挂图画能够<b class='flag-5'>发声</b>的工作原理

    扬声器的发声原理是什么

    扬声器的发声原理是一个涉及电声转换的复杂过程,其核心在于将电信号转化为声波,从而被人耳所接收。
    的头像 发表于 08-08 18:16 1697次阅读

    ESP32-WROOM-32板子在使用蓝牙串口与PWM冲突怎么解决这个问题?

    );); 我遇到的问题是:当使用有线串口时,蜂鸣器正常工作(发声);但当连接蓝牙成功时,蜂鸣器不能工作(无声);而且此时断开蓝牙串口,也不能发声,只能重新上电,并不连接蓝牙时才能正常发声
    发表于 07-01 07:24

    未来之声 | 人形机器人说话篇:无声

    随着一个个有关人形机器人的“核弹式”新闻的出现,机器人技术肉眼可见地快速发展。或许,与人们预想的“像人一样说话”不同,未来人形机器人说话方式是:无声
    的头像 发表于 04-13 08:00 278次阅读
    <b class='flag-5'>未来</b>之声 | 人形机器人说话篇:<b class='flag-5'>无声</b>!

    从S1C31D41解析爱普生(EPSON)MCU系列语音芯片

    语音芯片主要特性是功耗低,抗干扰能力强,外围器件少,控制简单,语音保存时间久,掉电不丢失语音,部分芯片还可以重复擦写语音内容。但是很多客户没有类似的开发经验或者他们的产品内部只能承载一
    的头像 发表于 03-15 09:05 1454次阅读
    从S1C31D41解析爱普生(EPSON)MCU系列<b class='flag-5'>语音</b>芯片

    车内语音识别技术:智能驾驶的核心要素

    一、引言 随着科技的飞速发展,智能驾驶已经成为未来出行的趋势。作为智能驾驶的关键技术之一,车内语音识别技术发挥着越来越重要的作用。它不仅提升了驾驶的便捷性和安全性,也为驾驶提供了更加个性化、智能化
    的头像 发表于 02-19 11:42 757次阅读

    车内语音识别技术:重塑智能驾驶的未来

    一、引言 随着科技的飞速发展,智能驾驶已经成为未来交通的必然趋势。作为智能驾驶的关键技术之一,车内语音识别技术正逐渐成为研究的热点。它不仅提高了驾驶的便捷性和安全性,也为驾驶提供了更加
    的头像 发表于 02-19 10:09 636次阅读

    语音数据集在智能语音助手中的应用与挑战

    。本文将详细介绍语音数据集在智能语音助手中的应用、面临的挑战以及未来的发展趋势。 二、语音数据集在智能语音助手中的应用
    的头像 发表于 01-18 15:46 387次阅读