0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里达摩院公布自研语音识别模型DFSMN,识别准确率达96.04%

肖青梅 来源:未知 作者:xiaoqingmei 2018-06-07 14:36 次阅读

【导读】:日前,阿里巴巴达摩院机器智能实验室推出了新一代语音识别模型DFSMN,据悉语音识别准确率达96.04%,未来将用于智能家居设备。

达摩院机器智能实验室的语音识别团队主导了这个模型的研发,并宣布向全世界企业与个人开源。对比目前业界使用最为广泛的LSTM模型,DFSMN模型训练速度更快、识别准确率更高。采用全新DFSMN模型的智能音响或智能家居设备,相比前代技术深度学习训练速度提到了3倍,语音识别速度提高了2倍。

在近期举行的云栖大会武汉峰会上,装有DFSMN语音识别模型的“AI收银员”在与真人店员的PK中,在嘈杂环境下准确识别了用户的语音点单,在短短49秒内点了34杯咖啡。此外,装备这一语音识别技术的自动售票机也已在上海地铁“上岗”。

著名语音识别专家,西北工业大学教授谢磊表示:“阿里此次开源的DFSMN模型,在语音识别准确率上的稳定提升是突破性的。是近年来深度学习在语音识别领域最具代表性的成果之一。对全球学术界和AI技术应用都有巨大影响。”有业内人士称,DFSMN有望成为继传统的LSTM模型后,成为全球语音识别领域最主要的声学识别模型之一。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1608

    浏览量

    47101
  • 语言识别
    +关注

    关注

    0

    文章

    15

    浏览量

    4813
收藏 人收藏

    评论

    相关推荐

    ASR与传统语音识别的区别

    识别技术。 构建更深更复杂的神经网络模型,利用大量数据进行训练。 提高了语音识别准确率和稳定性。 传统
    的头像 发表于 11-18 15:22 272次阅读

    ai人工智能回答准确率高吗

    ,AI可能表现出较高的准确率。例如,在图像识别语音识别等领域,经过大量训练的AI系统通常能够取得令人满意的准确率。 然而,在其他领域或场景
    的头像 发表于 10-17 16:30 1901次阅读

    NRK3301识别语音芯片在智能按摩椅中的应用与体验提升

    了新的变革。‌一、高识别准确率和快速响应‌NRK3301语音识别芯片采用最新的神经网络(‌TDNN)‌算法,‌具有高识别
    的头像 发表于 08-03 08:07 361次阅读
    NRK3301<b class='flag-5'>识别</b><b class='flag-5'>语音</b>芯片在智能按摩椅中的应用与体验提升

    什么是离线语音识别芯片?与在线语音识别的区别

    离线语音识别芯片适用于智能家电等,特点为小词汇量、低成本、安全性高、响应快,无需联网。在线语音识别功能更广泛、识别
    的头像 发表于 07-22 11:33 364次阅读

    Transformer模型语音识别语音生成中的应用优势

    随着人工智能技术的飞速发展,语音识别语音生成作为人机交互的重要组成部分,正逐渐渗透到我们生活的各个方面。而Transformer模型
    的头像 发表于 07-03 18:24 951次阅读

    有效提升智能会议系统语音识别准确性案例分享

    语音识别技术是在智能会议系统中至关重要,准确的智能会议语音识别能力,意味着会议参与者可以通过语音
    的头像 发表于 06-21 11:15 291次阅读
    有效提升智能会议系统<b class='flag-5'>语音</b><b class='flag-5'>识别</b><b class='flag-5'>准确</b>性案例分享

    有效提升智能会议系统语音识别准确性案例分享

    语音识别技术是在智能会议系统中至关重要,准确的智能会议语音识别能力,意味着会议参与者可以通过语音
    的头像 发表于 06-21 11:13 429次阅读
    有效提升智能会议系统<b class='flag-5'>语音</b><b class='flag-5'>识别</b><b class='flag-5'>准确</b>性案例分享

    阿里达摩提出“知识链”框架,降低大模型幻觉

    近日,阿里巴巴达摩(湖畔实验室)携手新加坡南洋理工大学等研究机构,共同推出了大模型知识链(CoK)框架。该框架不仅可实时检索异构知识源,还能逐步纠正推理错误,有效提高了大
    的头像 发表于 05-10 11:46 656次阅读

    在全志V853平台上成功部署深度学习步态识别算法

    集上测试了NB模型的步态识别准确率。CASIA-B是一个大规模、多视角的步态识别数据集,共包含124个样本,每个样本都有10种步态序列,分为6个正常行走的序列(NM),2个身着长外套行
    发表于 03-04 10:15

    重塑翻译与识别技术:开源语音识别模型Whisper的编译优化与部署

    模型介绍Whisper模型是一个由OpenAI团队开发的通用语音识别模型。它的训练基于大量不同的音频数据集,是一个多任务
    的头像 发表于 01-06 08:33 3375次阅读
    重塑翻译与<b class='flag-5'>识别</b>技术:开源<b class='flag-5'>语音</b><b class='flag-5'>识别</b><b class='flag-5'>模型</b>Whisper的编译优化与部署

    离线语音识别,“自然说”为产品赋能

    相比于云端语音识别,离线语音识别技术具有更高的识别准确率和更快的响应速度。因为离线
    的头像 发表于 12-11 11:20 446次阅读
    离线<b class='flag-5'>语音</b><b class='flag-5'>识别</b>,“自然说”为产品赋能

    阿里达摩裁撤量子实验室证实!

    阿里达摩证实,他们已经决定裁撤量子实验室,并将实验室及仪器设备捐赠给浙江大学。这一举措的目的是为了促进量子科技的协同发展,并将捐赠的实验室和设备开放给浙江大学及其他高校和科研机构使用。
    的头像 发表于 11-28 18:20 1068次阅读

    阿里达摩量子实验室裁撤 整体捐献给浙江大学

    日前,阿里达摩量子实验室裁撤,达摩量子实验室以及仪器设备全部被捐给浙江大学。相关信息从首席科学家施尧耘发布的动态可以印证;这可以说是来自
    的头像 发表于 11-28 16:04 597次阅读

    影响语音芯片识别率的因素概述

    语音芯片识别率是指芯片对人类语音信号的识别能力。在实际应用中,语音芯片识别率的高低直接影响了用户
    的头像 发表于 11-27 10:21 543次阅读

    离线语音识别及控制是怎样的技术?

    信号转化为文本或语义结果。  与传统的云端语音识别相比,离线语音识别的工作原理是将语音识别技术算
    发表于 11-24 17:41