0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里AI科技语音交互技术,已实现在85分贝工业噪声下将语音转换为文字

Qp2m_ggservicer 来源:未知 作者:李倩 2018-05-03 16:05 次阅读

近日,阿里巴巴机器智能技术实验室消息,其正研发在高工业噪声环境下的语音识别及传输技术,以后,众多车间工人将告别“通讯靠吼”的境况,简单的交流言语会转换成文字,让彼此心领神会。

图:阿里巴巴工程师正在调试AI语音识别系统

根据《职业性噪声聋诊断标准》等相关标准,噪声大于等于85分贝便可认定为噪声作业环境,工人需有所防护。

阿里巴巴AI语音工程师许先生介绍,很多中小型工厂车间的噪声都在90分贝以上。而工人很少佩戴防护器具。

在金华一家小型印刷厂,车间噪声接近90分贝。一位工人说,他每天工作10个小时左右,工厂接单多,他和同事须时刻交流、协同调适印刷机。“带上防护耳罩就听不见同事说话。”

浙江省疾控中心4月25日公布职业病数据显示,近10年来,浙江省新发5924例职业病中,职业性噪声聋占29.21%。浙江省疾控中心环境与职业卫生所副所长张美辨表示,工人长期接触超85分贝噪声易患职业性噪声聋。

2018年1月,国家安全监管总局网站公布的2015、2016年全国职业病报告来看。职业性噪声聋已成“尘肺病”之后的第二大职业病。

图:在高噪声环境下,阿里巴巴工程师正在测试语音识别设备

要预防职业性噪声聋并不容易。

阿里巴巴AI语音工程师许先生表示,大多数中小制造企业没经验和能力考虑降噪。最现实的,还是给工人戴防护耳罩,但又不便于交流。

许工程师介绍,他们研究的语音交互技术,已实现在85分贝工业噪声下,将一米处正常音量语音转换为文字。

图:高噪声语音交互系统构想图

语音转换都在云端完成,只要有网络并配上类似智能音箱的语音终端,便可构建局域性的语音文字转换和传输系统。

“转换为文字的信息,可指定传输至手机等带显示屏设备。只要一部手机,一个语音终端,便可组建高噪声语音交互系统。”许工程师说表示他和同事的语音测试仍在继续,“85分贝还是太安静,按照预期,要在95分贝噪音下识别语音。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音识别
    +关注

    关注

    38

    文章

    1725

    浏览量

    112553
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1610

    浏览量

    47114

原文标题:GGAI 前沿 | 阿里AI科技正终结“耳聋工厂”:85分贝噪声下仍可识别语音

文章出处:【微信号:ggservicerobot,微信公众号:高工智能未来】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    语音识别与自然语言处理的关系

    了人机交互的革命,使得机器能够更加自然地与人类沟通。 语音识别技术概述 语音识别,也称为自动语音识别(ASR),是指
    的头像 发表于 11-26 09:21 153次阅读

    ASR语音识别技术应用

    语音识别技术应用的分析: 一、ASR语音识别技术原理 ASR语音识别技术的基本原理是
    的头像 发表于 11-18 15:12 329次阅读

    如何用PCM1808来获取MIC的音量?最大值能到130分贝吗?

    出现了一个问题,从PCMI808获取的数据一直再跳,用(LP = 20log(Prms/pref))这个公式换算出来的音量一直在100分贝到144分贝,偶尔也会有90多分贝、10多分贝
    发表于 10-11 07:13

    输入文字转化语音

    一、介绍 基于鸿蒙Next模拟一个输入用户文字,转化成语音播报效果二、场景需求 辅助功能:为视障人士提供帮助:文字内容转化为语音,使视觉障
    发表于 08-28 10:54

    【算能RADXA微服务器试用体验】+ GPT语音与视觉交互:4,文字语音

    文字语音使用的技术简称为TTS。一般情况我用的都是在线的EDGE-TTS服务。但非常幸运的是,BM1684X上居然有适配好的本地运行TTS,那自然是要体验一番。 先转到projec
    发表于 07-15 23:18

    聆思CSK6视觉语音大模型AI开发板入门资源合集(硬件资料、大模型语音/多模态交互/英语评测SDK合集)

    丰富外设配件 配套多模态应用示例,支持快速上手体验大模型语音交互、智能视觉等 AI 应用 板载 DAPLINK 调试器,外接一条USB 线即可实现烧录、调试、串口日志查看 板载网络模组
    发表于 06-18 17:33

    语音控制模块_雷龙发展

    、回声消除、降噪等处理,以提高语音信号的质量。同时,进行采样和量化,连续的模拟信号转换为离散的数字信号。主要通过DSP来处理,雷龙语音模块内置DSP芯片,可以做各种卷积和数字滤波处理
    发表于 06-14 17:18

    苹果iOS18新增多款AI功能

    语音备忘录转录:苹果将在“语音备忘录”应用中增加一个大录音按钮,用户只需按即可开始录音,随后系统内建的AI模型将自动
    的头像 发表于 05-27 11:04 511次阅读

    智能语音交互技术如何助力设备实现人机自然对话

    智能语音交互技术是指通过语音识别、语音合成和自然语言理解等技术
    的头像 发表于 05-23 15:14 358次阅读

    语音识别技术在金融领域中的应用实例

    随着语音识别技术与文本挖掘、自然语言处理等技术的不断融合,智能语音交互技术在金融领域中爆发了出巨
    的头像 发表于 05-16 16:55 551次阅读
    标<b class='flag-5'>贝</b><b class='flag-5'>语音</b>识别<b class='flag-5'>技术</b>在金融领域中的应用实例

    苹果iOS 18备忘录搭载AI升级功能,新增语音文字和文本摘要功能

    其中,针对语音备忘录,苹果将在该应用中加入一个较大的录音按键,据称占据应用界面的显著位置。用户只需轻按此键即可开始录音,随后,系统内置的AI模型会将语音
    的头像 发表于 05-11 10:50 746次阅读

    玩转语音合成芯片(TTS芯片),看这一篇就够了

    什么是语音合成芯片:语音合成芯片也称为TTS芯片,即文字语音芯片,是一种能够输入的文字信息
    的头像 发表于 03-19 18:13 1324次阅读
    玩转<b class='flag-5'>语音</b>合成芯片(TTS芯片),看这一篇就够了

    语音数据集:AI语音技术的灵魂

    一、引言 在人工智能领域,语音技术被誉为“未来人机交互的入口”,而语音数据集则是AI语音
    的头像 发表于 12-14 14:33 980次阅读

    离线语音识别技术:掌控未来的语音交互

    离线语音识别技术的核心优势在于其独立性和实时性。在没有网络连接的情况,设备依然能够迅速识别用户的语音指令,实现各种功能。这使得
    的头像 发表于 12-13 11:12 553次阅读
    离线<b class='flag-5'>语音</b>识别<b class='flag-5'>技术</b>:掌控未来的<b class='flag-5'>语音</b><b class='flag-5'>交互</b>

    语音数据集:推动AI语音技术的核心力量

    一、引言 随着人工智能的快速发展,语音技术作为人机交互的重要手段,正发挥着越来越重要的作用。而语音数据集则是推动AI
    的头像 发表于 12-12 11:32 675次阅读