0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

失语者的未来:无声语音的数字发声

ss 来源:陈述根本 作者:陈根 2020-11-30 15:26 次阅读

人工智能技术的精进与开发无疑对人工智能的应用至关重要,而人工智能除了在与生活强关联方面的应用,回应少数群体的需求也将成为人工智能发展的必然方向。

近日,加州大学伯克利分校的研究人员表示,他们正在使用无声语言和收集肌肉活动的传感器来训练人工智能。其中,无声语言是用肌电图(EMG)检测的,电极则放在脸和喉咙上。研究人员表示,该模型的重点是研究被称之为“沉默语音”的模型,该模型可以检测到人们想说、但没说出声的话。

研究人员相信,他们的方法可以为那些无法发出声音的人提供大量的应用,并且可以支持人工智能助手或其他对语音命令做出响应的设备进行沉默语音检测。

尽管设想美好,但想真正实现却并不容易:首先,在收集数据时,研究者会先在实验者的脸上等部位贴8个贴片,每个贴片都是一个“监视肌肉变化”的传感器。

随后,研究人员需要录制一段实验者的有声语音,并与肌电图进行对应这种方法能够将肌肉的变化情况、和语音的类型对应起来。然后使用WaveNet解码器生成音频语音预测。在记录数据的过程中,还要再录制一段“对口型”的肌电图,但不需要发声,也就是“沉默语音”。

与用发声肌电数据训练的基线相比,该方法在书中句子转录的单词错误率下降了64%到4%,错误率比基线减少了95%。此外,为了推动这一领域的进一步研究,研究人员还开发了一个由近20小时面部肌电数据组成的数据集。

这项题为“无声语音的数字发声”的研究论文,在近日举行的自然语言处理经验方法(EMNLP)活动上,获得了最佳论文奖。

研究小组的论文写道:“数字化无声语音有着广泛的潜在应用。”例如,它可以用来制造一种类似于蓝牙耳机的设备,它允许人们在不干扰周围人的情况下进行电话交谈。而显然,这种设备在环境噪音太大无法捕捉到可听语音或保持沉默的环境中将具有重要作用。

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能
    +关注

    关注

    8

    文章

    1701

    浏览量

    117386
  • AI
    AI
    +关注

    关注

    87

    文章

    29951

    浏览量

    268252
  • 数字化
    +关注

    关注

    8

    文章

    8569

    浏览量

    61606
收藏 人收藏

    评论

    相关推荐

    PCM1794数字模拟分开供电,二地通过一个磁珠连接,pcm1794有轻微发热正常吗?

    PCM1794数字模拟分开供电,二地通过一个磁珠连接。后边使用官方滤波电路,刚开始工作正常,但是pcm1794有轻微发热,正常吗?另外工作一段时间后(大概十几分钟,有时候半个小时)就不能发声
    发表于 11-05 07:23

    TLV320AIC33更换后数字mic无声音是怎么回事?

    请问原本pcba上的TLV320AIC33发生不良后,重新更换新的TLV320AIC33后数字mic无声音? 电压供电都正常,是否需要重新code编译? 怎样才能数字MIC正常工作?需要烧录软件吗?
    发表于 10-29 07:57

    功放SR5200中置音箱无声音是什么原因?怎么解决?

    请教各位高手,马兰士功放SR5200,以前是在数字播放模式下选择PRO LOGIC播放时,环绕有声音,主声道和中置无声音,模拟播放主声道有声音,按照网友的指导,更换了IC4391。现在数字播放
    发表于 10-29 07:37

    请问PCM1795输出无声音是怎么解决?

    PCM1795输出无声问题,附件是原理图请帮忙看一下有什么问题
    发表于 10-16 06:59

    在仿真放大器时,如何让speaker发声呢?

    在仿真放大器时,发现TINA-TI Speaker 无声?如何让speaker发声呢?
    发表于 10-10 08:29

    早教有声挂图画能够发声的工作原理

    有声挂图通常分为单语、双语、多语,单面、双面,以及凹凸和平面之分。至于它能够发声主要依赖于内部的语音芯片,这些芯片能够响应小孩子的触摸操作,触发特定的声音播放。通过精心设计的图案和对应的发声位置
    的头像 发表于 08-30 12:05 302次阅读
    早教有声挂图画能够<b class='flag-5'>发声</b>的工作原理

    ESP32-WROOM-32板子在使用蓝牙串口与PWM冲突怎么解决这个问题?

    );); 我遇到的问题是:当使用有线串口时,蜂鸣器正常工作(发声);但当连接蓝牙成功时,蜂鸣器不能工作(无声);而且此时断开蓝牙串口,也不能发声,只能重新上电,并不连接蓝牙时才能正常发声
    发表于 07-01 07:24

    未来之声 | 人形机器人说话篇:无声

    随着一个个有关人形机器人的“核弹式”新闻的出现,机器人技术肉眼可见地快速发展。或许,与人们预想的“像人一样说话”不同,未来人形机器人说话方式是:无声
    的头像 发表于 04-13 08:00 210次阅读
    <b class='flag-5'>未来</b>之声 | 人形机器人说话篇:<b class='flag-5'>无声</b>!

    从S1C31D41解析爱普生(EPSON)MCU系列语音芯片

    语音芯片主要特性是功耗低,抗干扰能力强,外围器件少,控制简单,语音保存时间久,掉电不丢失语音,部分芯片还可以重复擦写语音内容。但是很多客户没有类似的开发经验或者他们的产品内部只能承载一
    的头像 发表于 03-15 09:05 1369次阅读
    从S1C31D41解析爱普生(EPSON)MCU系列<b class='flag-5'>语音</b>芯片

    车内语音识别技术:重塑智能驾驶的未来

    一、引言 随着科技的飞速发展,智能驾驶已经成为未来交通的必然趋势。作为智能驾驶的关键技术之一,车内语音识别技术正逐渐成为研究的热点。它不仅提高了驾驶的便捷性和安全性,也为驾驶提供了更加
    的头像 发表于 02-19 10:09 575次阅读

    语音数据集:AI语音技术的灵魂

    一、引言 在人工智能领域,语音技术被誉为“未来人机交互的入口”,而语音数据集则是AI语音技术的灵魂。本文将深入探讨语音数据集的重要性、构建方
    的头像 发表于 12-14 14:33 960次阅读

    情感语音识别的挑战与未来趋势

    一、引言 情感语音识别是一种通过分析和理解人类语音中的情感信息来实现智能交互的技术。尽管近年来取得了显著的进步,但情感语音识别仍然面临着诸多挑战。本文将探讨情感语音识别所面临的挑战以及
    的头像 发表于 11-30 11:24 491次阅读

    浅谈情感语音识别:技术发展与未来趋势

    一、引言 情感语音识别是一种新兴的人工智能技术,它通过分析人类语音中的情感信息,实现人机之间的情感交互。本文将探讨情感语音识别技术的发展历程、现状以及未来趋势。 二、情感
    的头像 发表于 11-30 11:06 683次阅读

    情感语音识别的现状与未来趋势

    情感语音识别是一种涉及多个学科领域的前沿技术,包括心理学、语言学、计算机科学等。它通过分析人类语音中的情感信息,实现更加智能化和个性化的人机交互。本文将探讨情感语音识别的现状与未来趋势
    的头像 发表于 11-28 17:22 741次阅读

    情感语音识别:现状、挑战与未来趋势

    的现状、挑战与未来趋势。 二、情感语音识别的现状 技术发展:随着深度学习技术的不断进步,情感语音识别技术得到了快速发展。目前,基于卷积神经网络(CNN)、循环神经网络(RNN)和长短期记忆网络(LSTM)等深度学习模型的
    的头像 发表于 11-22 11:31 778次阅读