0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里开源自主研发AI语音识别模型

智能制造发展联盟 来源:未知 作者:胡薇 2018-06-10 10:08 次阅读

阿里巴巴达摩院推出AI语音识别模型:对全球开源

近日,阿里巴巴达摩院机器智能实验室语音识别团队,推出了新一代语音识别模型——DFSMN,不仅被谷歌等国外巨头在论文中重点引用,更将全球语音识别准确率纪录提升至96.04%(基于世界最大的免费语音识别数据库LibriSpeech)。

另外,该团队同时宣布,即日起向全世界企业与个人开源DFSMN模型,使全球开发者都能共享这一成果。

西北工业大学教授谢磊表示:“阿里此次开源的DFSMN模型,在语音识别准确率上的稳定提升是突破性的。是近年来深度学习在语音识别领域最具代表性的成果之一。对全球学术界和AI技术应用都有巨大影响。”

数据云

115科技和阿里云完成互联网史上最大数据迁移

近日,115科技和阿里云宣布完成阿里云史上最大数据迁移上云项目,115科技的全部数据都搬迁至阿里云上,规模超过100PB,整个项目耗时仅45天。有好奇的网友进行了速度计算,就算这45天一刻不停的连续传输,也需要27GB/秒的速度,工程堪称海量。

战略合作

中国联通与中国电子签署战略合作协议

近日,中国联合网络通信有限公司与中国电子信息产业集团有限公司在北京签署战略合作协议。根据合作协议,中国联通与中国电子将建立战略合作关系,发挥各自专业领域特点,整合优势资源,在互联网+智慧城市、智慧园区、数据中心、国产化替代、网络安全服务、行业信息化、网络服务和信息通信产品等方面展开共赢合作。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    29611

    浏览量

    267909
  • 语音识别
    +关注

    关注

    38

    文章

    1708

    浏览量

    112465
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1607

    浏览量

    47032

原文标题:【智能制造日报】阿里巴巴达摩院推出AI语音识别模型:对全球开源

文章出处:【微信号:IMA_MIIC,微信公众号:智能制造发展联盟】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Llama 3 与开源AI模型的关系

    在人工智能(AI)的快速发展中,开源AI模型扮演着越来越重要的角色。它们不仅推动了技术的创新,还促进了全球开发者社区的合作。Llama 3,作为一个新兴的
    的头像 发表于 10-27 14:42 270次阅读

    阿里国际发布翻译大模型Marco

    近日,阿里国际正式推出了其翻译大模型——Marco。这款模型已在阿里国际AI官网Aidge上线,并向全球用户开放使用。
    的头像 发表于 10-17 16:07 198次阅读

    摩尔线程正式开源音频理解大模型MooER

    近日,国内领先的GPU创新企业摩尔线程宣布了一项重大技术突破——正式开源自主研发的音频理解大模型MooER(摩耳)。这一举动标志着我国在音频处理与理解领域迈出了坚实的一步,特别是在基
    的头像 发表于 08-27 15:24 428次阅读

    努比亚发布自主研发的星云大模型,在AI技术领域又一重大突破

    7月23日最新资讯,努比亚于今日下午盛大召开“AI+双旗舰”新品发布会,震撼发布了其自主研发的星云大模型,标志着公司在AI技术领域的又一重大
    的头像 发表于 07-23 16:50 915次阅读

    Transformer模型语音识别语音生成中的应用优势

    随着人工智能技术的飞速发展,语音识别语音生成作为人机交互的重要组成部分,正逐渐渗透到我们生活的各个方面。而Transformer模型,自其诞生以来,凭借其独特的自注意力机制和并行计算
    的头像 发表于 07-03 18:24 887次阅读

    聆思CSK6视觉语音模型AI开发板入门资源合集(硬件资料、大模型语音/多模态交互/英语评测SDK合集)

    与硬件外设的开发板,采用具备丰富组件生态的 Zephyr RTOS作为操作系统,官方提供了十几种开源SDK,包含大模型语音交互、大模型拍照识图、文生图、人脸
    发表于 06-18 17:33

    开发者手机 AI - 目标识别 demo

    功能简介 该应用是在Openharmony 4.0系统上开发的一个目标识别AI应用,旨在从上到下打通Openharmony AI子系统,展示Openharmony系统的AI能力,并为
    发表于 04-11 16:14

    重塑翻译与识别技术:开源语音识别模型Whisper的编译优化与部署

    模型介绍Whisper模型是一个由OpenAI团队开发的通用语音识别模型。它的训练基于大量不同的音频数据集,是一个多任务
    的头像 发表于 01-06 08:33 3287次阅读
    重塑翻译与<b class='flag-5'>识别</b>技术:<b class='flag-5'>开源</b><b class='flag-5'>语音</b><b class='flag-5'>识别</b><b class='flag-5'>模型</b>Whisper的编译优化与部署

    开源项目】基于ESP32的语音识别控制AI小夜灯

    一、项目简介 使用ESP32-S3N8R8模块作为主控芯片,S3内核增加了用于加速神经网络计算和信号处理等的指令,这使得我们可以使用它来快速解析训练好的语音模型进行语音识别的功能。 二
    发表于 12-19 14:05

    在线研讨会 | 大模型时代语音 AI 模型的训练、优化与应用

    AI模型语音识别、自然语言处理等领域已经取得了令人瞩目的成就。语音 AI(Speech
    的头像 发表于 12-15 15:50 546次阅读
    在线研讨会 | 大<b class='flag-5'>模型</b>时代<b class='flag-5'>语音</b> <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>的训练、优化与应用

    语音数据集:AI语音技术的灵魂

    提升语音识别和生成能力:语音数据集为AI模型提供了丰富的语音样本,通过训练和学习这些数据,
    的头像 发表于 12-14 14:33 926次阅读

    语音数据集:推动AI语音技术的核心力量

    的发展趋势。 二、语音数据集的重要性 提高语音识别和生成能力:语音数据集包含大量的语音样本,可以为模型
    的头像 发表于 12-12 11:32 632次阅读

    阿里云通义千问720亿参数模型宣布开源

    12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。与此同时,他们还开源了18亿参数模型Qwen-1.8B和音频大
    的头像 发表于 12-01 17:08 1279次阅读

    我国首个自主研发的地球系统模型宣布开源

    模型
    北京中科同志科技股份有限公司
    发布于 :2023年11月18日 09:59:01

    基于深度学习的情感语音识别模型优化策略

    基于深度学习的情感语音识别模型的优化策略,包括数据预处理、模型结构优化、损失函数改进、训练策略调整以及集成学习等方面的内容。
    的头像 发表于 11-09 16:34 620次阅读