0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Daniel Povey:Kaldi 核心算法 K2 0.1 版本已发布

工程师邓生 来源:蓝鲸TMT 作者:蓝鲸TMT 2020-11-16 11:56 次阅读

11月15日讯,在第五届Kaldi技术交流会上,Kaldi之父Daniel Povey博士与来自北京各大互联网公司知名高校的开发者们深入交流下一代Kaldi社区未来的发展。

Daniel Povey博士目前担任小米集团语音首席科学家,由他开发和维护Kaldi 集成了多种语音识别模型,是业界语音识别框架基石。加入小米一年,Daniel Povey设计并开发出了新一代Kaldi。新一代Kaldi分成三个部分,包括核心算法部分,训练数据准备部分、示例脚本集合部分。

据介绍,其中,Lhotse(训练数据准备部分)将替代以前Kaldi中所有数据准备相关的工作,操作各种音频和文本的元数据。Lhotse除了Kaldi本身,也适用于其他应用。而且Lhotse纯Python代码,方便易用。

Icefall(示例脚本集合部分)将代替Kaldi中的示例脚本集合,并独立成为一个单独的子项目。之所以要把示例脚本集合与核心算法分开,是考虑到示例脚本可能会非常庞大,且经常变动。

新一代Kaldi的核心部分叫“k2”。k2可以让开发者很容易在PyTorch/TensorFlow中实现各种语音识别相关算法,比如CTC、LF—MMI、RNN—T、2nd—pass语言模型等,消除以往语音识别算法中训练跟解码不匹配的问题。同时,通过k2可以实现(置信度逐渐提高的)多轮解码过程。

Daniel Povey博士透露,k2核心代码已完成。约41000行代码(主要是C++),本周刚发布0.1版本。他在本次线下活动中强调:“今天有太多人依托Kaldi在做自己的事业,有很多人为Kaldi社区一直在做贡献,Kaldi会始终坚持开源。”

小米集团副总裁、技术委员会主席崔宝秋指出,拥抱开源是小米工程文化的重要组成部分。崔宝秋在接受蓝鲸TMT记者专访时表示,Kaldi的一些语音技术与代码已经在一些小米的产品线使用,未来其语音技术将在小米的手机、音箱、电视以及更多智能家居与智能穿戴设备中使用,小米非常重视语音技术。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4483

    浏览量

    91331
  • 核心技术
    +关注

    关注

    4

    文章

    625

    浏览量

    19477
  • 开源
    +关注

    关注

    3

    文章

    3051

    浏览量

    41830
  • 小米
    +关注

    关注

    69

    文章

    14220

    浏览量

    142359
收藏 人收藏

    评论

    相关推荐

    深度学习的基本原理与核心算法

    处理、语音识别等领域取得了革命性的突破。本文将详细阐述深度学习的原理、核心算法以及实现方式,并通过一个具体的代码实例进行说明。
    的头像 发表于 07-04 11:44 43次阅读

    【硬件开源】2K0300 蜂鸟核心板设计介绍及原理图文件下载

    2K0300 介绍 2K0300 平台板卡的产品规格书,用户手册等文档 1. 2K0300 蜂鸟核心2.
    发表于 06-20 14:28

    龙芯2K0300蜂鸟板支持OpenHarmony 4.0 Release版本操作系统

    龙芯2K0300蜂鸟板是基于龙芯中科自研的LoongArch架构2K0300处理器设计的,整体结构小巧紧凑,功能丰富齐全。龙芯2K0300蜂鸟板采用核心板加扩展底板的模块化设计方式,有
    发表于 06-20 10:02

    广东龙芯发布2K0300蜂鸟板,今日正式发售

    6月18日,广东龙芯中科电子科技有限公司在广州发布了龙芯2K0300蜂鸟开发系统,其中重点打造的2K0300蜂鸟开发板,今天开始在合作伙伴润开鸿的淘宝企业店上架正式发售,购买链接和与之对应的板卡资料
    发表于 06-20 10:00

    龙芯 2K0300 蜂鸟开发系统正式发布!!

    龙芯2K0300蜂鸟开发系统正式发布 6月18日,龙芯2K0300蜂鸟开发系统发布暨技术交流会在广州成功举办。百余位嵌入式领域的业界专家、合作伙伴、工程师等齐聚羊城,围绕技术创新、实践
    发表于 06-19 16:27

    机器学习六大核心算法深度解析

    算法历程:线性回归是一种古老的统计方法,它试图找到最佳拟合数据的直线或超平面,最早可以追溯到19世纪初的高斯最小二乘法理论。
    发表于 04-23 16:25 512次阅读
    机器学习六大<b class='flag-5'>核心算法</b>深度解析

    陀螺仪芯片+传感器定制

    本人想开发一套摔倒瞬间的触发系统,目前缺主程序核心算法。有懂的大神求指教
    发表于 03-21 10:36

    Embedded office发布安全插件V1.1版本

    Embedded office很高兴地宣布安全插件V1.1版本发布了!现在通过外部设备或不同核心架构的专门通道支持端到端受保护的安全通信。
    的头像 发表于 02-20 11:12 350次阅读

    华测导航:不断优化核心算法,同时布局车规级芯片

    华测导航推出的新一代cgi-430高精密惯性导航系统以系统全体频率的gnss基础卡和6轴战术级imu为基础,使用中国领航员的新一代贴合算法引擎,结合gnss、ins、dr信息进行计算。
    的头像 发表于 11-14 14:34 787次阅读

    八只流水灯当开关k1按下时流水灯循环,开关k2按下时停止循环是为什么?

    单片机proteus仿真:八只流水灯当开关k1按下时流水灯循环,开关k2按下时停止循环
    发表于 09-27 06:15

    沐曦携手富春云打造国产GPU华北核心算力节点

    近日,沐曦集成电路(上海)有限公司(以下简称“沐曦”)与浙江日报报业集团旗下北京富春云网络科技有限公司(以下简称“富春云”)在浙报数字文化科技园举行“沐曦富春云国产GPU华北核心算力节点项目”签约仪式,沐曦销售副总裁裘敏松、富春云总裁朱成永代表合作双方完成签约。
    的头像 发表于 09-20 14:16 923次阅读

    DSP算法大全C语言版本

    DSP算法大全C语言版本
    发表于 09-13 16:43 13次下载

    全国产EtherCAT运动控制边缘控制器-ZMC432H

    ZMC432H,硬件核心器件全国产,软件核心算法自主自研自主可控。
    的头像 发表于 07-25 09:58 488次阅读
    全国产EtherCAT运动控制边缘控制器-ZMC432H

    基于Kaldi的语音识别引擎的架构设计方案

    58自研语音识别引擎,最初是基于Kaldi框架进行开发,在自研初期上线了架构1.0版本,后续以降低机器资源、提升资源利用率、优化性能为目标进行了升级重构,上线了架构2.0版本
    发表于 07-23 14:59 450次阅读
    基于<b class='flag-5'>Kaldi</b>的语音识别引擎的架构设计方案

    800V扁线电机部分核心技术解析

    阐述了电动汽车动力电池管理系统的特点及其核心算法开发的关键技术问题,详细介绍了动力电池测试、建模、状态估计、剩余寿命预测、故障诊断、低温加热、优化充电、算法开发。
    发表于 07-10 11:39 314次阅读
    800V扁线电机部分<b class='flag-5'>核心</b>技术解析