0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里AI科技语音交互技术,已实现在85分贝工业噪声下将语音转换为文字

Qp2m_ggservicer 来源:未知 作者:李倩 2018-05-03 16:05 次阅读

近日,阿里巴巴机器智能技术实验室消息,其正研发在高工业噪声环境下的语音识别及传输技术,以后,众多车间工人将告别“通讯靠吼”的境况,简单的交流言语会转换成文字,让彼此心领神会。

图:阿里巴巴工程师正在调试AI语音识别系统

根据《职业性噪声聋诊断标准》等相关标准,噪声大于等于85分贝便可认定为噪声作业环境,工人需有所防护。

阿里巴巴AI语音工程师许先生介绍,很多中小型工厂车间的噪声都在90分贝以上。而工人很少佩戴防护器具。

在金华一家小型印刷厂,车间噪声接近90分贝。一位工人说,他每天工作10个小时左右,工厂接单多,他和同事须时刻交流、协同调适印刷机。“带上防护耳罩就听不见同事说话。”

浙江省疾控中心4月25日公布职业病数据显示,近10年来,浙江省新发5924例职业病中,职业性噪声聋占29.21%。浙江省疾控中心环境与职业卫生所副所长张美辨表示,工人长期接触超85分贝噪声易患职业性噪声聋。

2018年1月,国家安全监管总局网站公布的2015、2016年全国职业病报告来看。职业性噪声聋已成“尘肺病”之后的第二大职业病。

图:在高噪声环境下,阿里巴巴工程师正在测试语音识别设备

要预防职业性噪声聋并不容易。

阿里巴巴AI语音工程师许先生表示,大多数中小制造企业没经验和能力考虑降噪。最现实的,还是给工人戴防护耳罩,但又不便于交流。

许工程师介绍,他们研究的语音交互技术,已实现在85分贝工业噪声下,将一米处正常音量语音转换为文字。

图:高噪声语音交互系统构想图

语音转换都在云端完成,只要有网络并配上类似智能音箱的语音终端,便可构建局域性的语音文字转换和传输系统。

“转换为文字的信息,可指定传输至手机等带显示屏设备。只要一部手机,一个语音终端,便可组建高噪声语音交互系统。”许工程师说表示他和同事的语音测试仍在继续,“85分贝还是太安静,按照预期,要在95分贝噪音下识别语音。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音识别
    +关注

    关注

    38

    文章

    1660

    浏览量

    111994
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1590

    浏览量

    46589

原文标题:GGAI 前沿 | 阿里AI科技正终结“耳聋工厂”:85分贝噪声下仍可识别语音

文章出处:【微信号:ggservicerobot,微信公众号:高工智能未来】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    聆思CSK6视觉语音大模型AI开发板入门资源合集(硬件资料、大模型语音/多模态交互/英语评测SDK合集)

    丰富外设配件 配套多模态应用示例,支持快速上手体验大模型语音交互、智能视觉等 AI 应用 板载 DAPLINK 调试器,外接一条USB 线即可实现烧录、调试、串口日志查看 板载网络模组
    发表于 06-18 17:33

    语音控制模块_雷龙发展

    、回声消除、降噪等处理,以提高语音信号的质量。同时,进行采样和量化,连续的模拟信号转换为离散的数字信号。主要通过DSP来处理,雷龙语音模块内置DSP芯片,可以做各种卷积和数字滤波处理
    发表于 06-14 17:18

    智能语音交互技术如何助力设备实现人机自然对话

    智能语音交互技术是指通过语音识别、语音合成和自然语言理解等技术
    的头像 发表于 05-23 15:14 198次阅读

    苹果iOS 18备忘录将搭载AI升级功能,新增语音文字和文本摘要功能

    其中,针对语音备忘录,苹果将在该应用中加入一个较大的录音按键,据称将占据应用界面的显著位置。用户只需轻按此键即可开始录音,随后,系统内置的AI模型会将语音转换为
    的头像 发表于 05-11 10:50 363次阅读

    玩转语音合成芯片(TTS芯片),看这一篇就够了

    什么是语音合成芯片:语音合成芯片也称为TTS芯片,即文字语音芯片,是一种能够将输入的文字信息转换为
    的头像 发表于 03-19 18:13 695次阅读
    玩转<b class='flag-5'>语音</b>合成芯片(TTS芯片),看这一篇就够了

    语音数据集:AI语音技术的灵魂

    一、引言 在人工智能领域,语音技术被誉为“未来人机交互的入口”,而语音数据集则是AI语音
    的头像 发表于 12-14 14:33 503次阅读

    语音数据集:推动AI语音技术的核心力量

    一、引言 随着人工智能的快速发展,语音技术作为人机交互的重要手段,正发挥着越来越重要的作用。而语音数据集则是推动AI
    的头像 发表于 12-12 11:32 394次阅读

    离线语音识别及控制是怎样的技术

    引言:  随着人工智能的飞速发展,离线语音识别技术成为了一项备受瞩目的创新。离线语音识别技术能够人的
    发表于 11-24 17:41

    情感语音识别技术在人机交互中的应用与挑战

     一、引言 随着人工智能技术的不断发展,人机交互已经成为了研究的热点之一。情感语音识别技术作为人机交互中的重要组成部分,能够通过识别人的
    的头像 发表于 11-09 15:27 486次阅读

    离线语音识别和控制的工作原理及应用

    引言   离线语音识别是指在没有网络连接的情况,通过在本地设备上进行语音信号处理和识别,实现语音命令的转化和执行。随着智能设备的普及,离
    发表于 11-07 18:01

    语音识别技术在智能客服领域的应用与挑战

    的应用与挑战。 二、语音识别技术在智能客服领域的应用 1.语音文字语音识别技术可以将客户的
    的头像 发表于 10-25 10:37 423次阅读

    Whisper语音文字教程

    语音文字在许多不同领域都有着广泛的应用。以下是一些例子: 1.字幕制作:语音文字可以帮助视频制作者快速制作字幕,这在影视行业和网络视频领域非常重要。通过使用
    的头像 发表于 10-16 11:26 640次阅读
    Whisper<b class='flag-5'>语音</b>转<b class='flag-5'>文字</b>教程

    语音合成技术的简介与未来发展

    语音合成是一种通过计算机技术生成人类可听的语音技术。它将文本转换为语音,从而
    的头像 发表于 09-15 18:17 1117次阅读

    语音转换,自由切换你的声音,思必驰语音技术上新

    语音转换(Voice Conversion, VC)即在保留语音内容的同时,将原说话人的音色转换成指定说话人的音色。在传统变声工具中,基于语音
    的头像 发表于 09-14 16:23 847次阅读

    智能座舱的语音交互系统技术应用

    从用户发出语音指令到实现与智能设备的交互,其过程并不像其名词描述的那么简单,要实现通过语音来完成人机交互
    发表于 07-28 10:17 413次阅读
    智能座舱的<b class='flag-5'>语音</b><b class='flag-5'>交互</b>系统<b class='flag-5'>技术</b>应用