0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

研究人员已经开发出一种能够检测“无声语音”的AI模型

倩倩 来源:文财网 作者:文财网 2020-12-17 10:09 次阅读

加州大学伯克利分校的研究人员已经开发出一种能够检测“无声语音”的AI模型。该模型基于数字语音预测单词并生成合成语音。肌电图(EMG)的电极位于脸部和喉咙,用于检测无声语音。

研究人员断言,该模型可以为无法发出可听语音的人们启用许多应用程序,并可以帮助AI工具和其他响应语音命令的设备进行语音检测。

该小组指出,以数字方式为无声语音发声具有广泛的应用。例如,它可以生成类似于蓝牙耳机的工具,该工具可以使个人继续通话,而不会打扰周围的人。当环境声音太大而无法捕获可听见的语音或必须保持安静时,这种设备将非常有用。

口头阅读AI是可以从静音语音中捕获单词的AI的另一个示例。它可以为监视设备供电,并支持聋人的用例。

研究人员使用了一种方法,其中将所需语句的音频输出目标从发声录音转换为无声录音。然后,使用WaveNet解码器生成音频语音预测。

通过比较发声的EMG数据和基线训练的数据,发现发声的EMG方法在从书中转录句子时,单词错误率降低了64%至4%,而基线降低了95%。研究人员开源了约20小时的面部EMG数据集,以鼓励对该领域进行进一步研究。

在其他工作中,中国的研究人员建立了讽刺检测模型,该模型在多模式Twitter数据集上提供SOTA性能。Masakhane开放源代码非洲语言翻译项目的成员已发布了 有关低资源机器翻译的 案例研究。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 解码器
    +关注

    关注

    9

    文章

    1129

    浏览量

    40660
  • 蓝牙耳机
    +关注

    关注

    19

    文章

    5657

    浏览量

    58779
  • AI
    AI
    +关注

    关注

    87

    文章

    29951

    浏览量

    268252
收藏 人收藏

    评论

    相关推荐

    BitEnergy AI公司开发出一种AI处理方法

    BitEnergy AI公司,家专注于人工智能(AI)推理技术的企业,其工程师团队创新性地开发一种名为线性复杂度乘法(L-Mul)的
    的头像 发表于 10-22 15:15 319次阅读

    基于一种AI辅助可穿戴微流控比色传感器系统

    存在的挑战限制了这项技术的实际应用。 据麦姆斯咨询报道,为了克服这些挑战,来自中国石油大学(华东)的研究人员开发一种人工智能(AI)辅助的可穿戴微流控比色传感器系统(
    的头像 发表于 06-29 10:57 1w次阅读
    基于<b class='flag-5'>一种</b><b class='flag-5'>AI</b>辅助可穿戴微流控比色传感器系统

    聆思CSK6视觉语音模型AI开发板入门资源合集(硬件资料、大模型语音/多模态交互/英语评测SDK合集)

    丰富外设配件 配套多模态应用示例,支持快速上手体验大模型语音交互、智能视觉等 AI 应用 板载 DAPLINK 调试器,外接条USB 线即可实现烧录、调试、串口日志查看 板载网络模组
    发表于 06-18 17:33

    基于助听器开发一种高效的语音增强神经网络

    受限的微控制器单元(microcontroller units,MCU)上,内存和计算能力有限。在这项工作中,我们使用模型压缩技术来弥补这差距。我们在HW上对RNN施加约束,并描述了一种方法来满足它们
    发表于 06-07 11:29

    OpenAI推出专用的AI检测工具

    OpenAI最近推出了款全新的AI检测工具,这款工具专门针对由DALL·E 3模型生成的图片。令人印象深刻的是,该工具能够精准识别出这类图
    的头像 发表于 05-09 10:01 480次阅读

    一种可实现稳定压力传感的新型可拉伸电子皮肤

    现有的电子皮肤会随材料拉伸而降低传感精度。美国得克萨斯大学奥斯汀分校研究人员开发出一种新型可拉伸电子皮肤,解决了这项新兴技术的个主要难题。
    的头像 发表于 05-09 09:07 430次阅读

    研究人员开发出新型AI辅助发音系统,让人没有声带也能说话

    电子发烧友网报道(文/李弯弯)近日,加州大学洛杉矶分校生物工程系助理教授陈俊及其团队,开发一种可以在机器学习辅助下将喉部肌肉运动转化为语音的“柔性贴片”助听装置,这将有望帮助部分嗓音障碍患者实现
    的头像 发表于 03-28 09:11 2290次阅读

    研究人员开发出一种新型太赫兹成像系统

    系统使用的辐射探测器。 由加州大学洛杉矶分校Samueli工程学院电气和计算机工程教授Mona Jarrahi和Aydogan Ozcan领导的研究团队发明了一种新的太赫兹焦平面阵列来解决这个问题。 带PSR的等离子体光电导THz-FPA 通过消除逐点捕获和显示图像
    的头像 发表于 01-19 10:05 769次阅读
    <b class='flag-5'>研究人员</b><b class='flag-5'>开发出</b><b class='flag-5'>一种</b>新型太赫兹成像系统

    语音数据集:推动智能语音技术发展的关键驱动力

    发展方向。 语音数据集的重要性 语音数据集是智能语音技术的基石,它提供了大量的语音样本和对应的标签,用于训练和评估
    的头像 发表于 12-28 13:46 507次阅读

    【飞腾派4G版免费试用】仙女姐姐的嵌入式实验室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

    训练是MetaAI研究人员认为的一种降低模型使用成本的方式。为了更好的效果,即便是LLaMA最小的70亿参数的版本,其训练使用的tokens数量也有1万亿个(1 trillion tokens) 但是
    发表于 12-22 10:18

    在线研讨会 | 大模型时代语音 AI 模型的训练、优化与应用

    AI模型语音识别、自然语言处理等领域已经取得了令人瞩目的成就。语音 AI(Speech
    的头像 发表于 12-15 15:50 560次阅读
    在线研讨会 | 大<b class='flag-5'>模型</b>时代<b class='flag-5'>语音</b> <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>的训练、优化与应用

    LabVIEW进行癌症预测模型研究

    LabVIEW进行癌症预测模型研究 癌症是一种细胞异常增生的疾病。随着年龄的增长,细胞分裂速度放缓,但癌细胞会失去控制地不断分裂,形成可能良性或恶性的肿瘤。 2012年的国际癌症数据显示,新发癌症
    发表于 12-13 19:04

    研究人员创造一种六角形心电图贴片 实现遥感与数据传输功能

    导    语在《Applied Physics Reviews》期刊上,研究人员提出了一种新型可穿戴心电图贴片,旨在增强床旁诊断,检测心血管疾病并帮助评估整体心脏健康状况。该研究的重点
    的头像 发表于 12-13 16:44 449次阅读

    研究人员设计一种新的3D喷墨打印技术

    据悉,只带韧带和肌腱的骨骼机械手现在可以通过次3D打印完成 —— 这是通过一种新的增材制造方法实现的,这种方法可以同时以高分辨率打印刚性和弹性材料。 这项新工作是瑞士苏黎世联邦理工学院的
    的头像 发表于 11-20 17:01 689次阅读

    一种能够模拟人类手指触觉的人工感知系统可高分辨率识别精细纹理

    据麦姆斯咨询报道,近日,南方科技大学联合西安电子科技大学的研究人员开发一种能够模拟人类手指触觉的人工感知系统
    的头像 发表于 11-20 09:14 839次阅读
    <b class='flag-5'>一种</b><b class='flag-5'>能够</b>模拟人类手指触觉的人工感知系统可高分辨率识别精细纹理