0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

吱一声就知道你是谁,深度学习识别短片段说话人

Hf1h_BigDataDig 来源:YXQ 2019-07-30 10:02 次阅读

UtterIdNet是一种新型的具有短语音片段识别能力的深度神经网络。该模型的灵感来自于两个成功且非常流行的深度神经网络架构:ResNet和DeepID3。据该模型背后的研究人员称,该模型采用了一种新的体系结构,通过在短语音片段中有效地增加信息的使用,使其适合于短片段说话人的识别。

他们在VoxCeleb数据集上对UtterIdNet进行了训练和测试,这是说话人识别的最新基准,并证明UtterIdNet在短片段上的表现优于最先进的技术。对不同分段持续时间的评估显示,短分段的性能一致且稳定,对于2秒、1秒、特别是微秒的分段,与之前的模型相比有显著改进。

随着智能虚拟助手的不断发展,它们对增强语音识别算法的要求也越来越高。与传统的先进模型相比,该模型显示了更好的结果。虽然在完整的语音片段中表现出了微弱的优势,这也是研究人员打算在未来的工作中进行研究的,但是UtterIdNet在增强短片段语音识别方面有很大的潜力。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音识别
    +关注

    关注

    38

    文章

    1725

    浏览量

    112575
  • 深度学习
    +关注

    关注

    73

    文章

    5493

    浏览量

    121014

原文标题:机器有了综合感官?新研究结合视觉和听觉进行情感预测 | 一周AI最火论文

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AIC33在经过数模转换后接了个功放,在对AIC33进行初始化完成后,会听到“啪”的一声,怎么解决?

    我的AIC33在经过数模转换后接了个功放,在对AIC33进行初始化完成后,会听到“啪”的一声,不知道有没有什么方法可以解决。
    发表于 11-08 08:00

    GPU深度学习应用案例

    GPU在深度学习中的应用广泛且重要,以下是些GPU深度学习应用案例: 、图像
    的头像 发表于 10-27 11:13 341次阅读

    TAS5719插入耳机时会有一声pop noise,怎么解决?

    问题描述:上电5秒后,插入耳机时,往Tas5719的0x05寄存器写入0x13,切换到耳机模式,耳机上可以听到正常的音乐,但耳机出声音前会听到一声pop noise。 问题概率:100% 问题补充
    发表于 10-24 08:06

    在AC off时, DRV632输出耳机会有爆音一声,如何改善?

    目前发现在 AC off 时, DRV632 输出, 耳机会有 爆音一声 耳机线路如附件, 请问是否有何改善方式呢 ?
    发表于 10-22 08:32

    TPA3116喇叭接入后能听到周期大约1s的非常小的一声bo,为什么?

    上图是我的应用的原理图,喇叭接入后能听到周期大约1s的非常小的一声bo,万用表测FAULTZ引脚可以看到喇叭没声的时候都是拉低的,发出bo的时候拉高,然后又被拉低。 把喇叭移除,用万用表观察FAULTZ脚,现象和上述是
    发表于 10-18 06:58

    tas5630B无继电器的情况下,会砰两是什么原因,怎么解决?

    一声,但是如果整个功放没有音频输入,上电不会砰的一声,但是关电时候会砰的一声。目前感觉砰的一声是音频信号输入导致,不知道是什么原因,能够怎
    发表于 10-16 08:14

    TAS5630B功放上电的时候都会有砰的一声,为什么?怎么处理?

    功放上电的时候都会有砰的一声,麻烦请告诉下原因,可以怎么处理,网上查了功放基本都有这个问题,使用的TAS5630B
    发表于 10-16 06:28

    TAS5630B功放上电打开继电器,砰的一声有没有什么办法解决?

    使用TAS5630B功放芯片,针对功放上电打开继电器,砰的一声有没有什么办法解决,可以的话请推荐个电路,
    发表于 10-15 06:43

    使用TPA3113作为扬声器放大,开机时SD信号为高电平的瞬间扬声器会有彭一声响,为什么?

    在笔记本项目上使用TPA3113作为扬声器放大,PM_EC_MUTE#是有EC控制,在开机的时候,即SD信号为高电平的瞬间扬声器会有彭一声响,,关机时候SD信号为低的瞬间也有一声碰响,其他时候都正常;请问这个bug 有没有办法优化
    发表于 10-12 08:20

    深度识别算法包括哪些内容

    深度识别算法是深度学习领域的个重要组成部分,它利用深度神经网络模型对输入数据进行高层次的理解和
    的头像 发表于 09-10 15:28 317次阅读

    深度识别人脸识别有什么重要作用吗

    深度学习人脸识别技术是人工智能领域的个重要分支,它利用深度学习算法来
    的头像 发表于 09-10 14:55 436次阅读

    基于Python的深度学习人脸识别方法

    基于Python的深度学习人脸识别方法是个涉及多个技术领域的复杂话题,包括计算机视觉、深度学习
    的头像 发表于 07-14 11:52 1198次阅读

    深度学习中的无监督学习方法综述

    深度学习作为机器学习领域的个重要分支,近年来在多个领域取得了显著的成果,特别是在图像识别、语音识别
    的头像 发表于 07-09 10:50 556次阅读

    基于深度学习的鸟类声音识别系统

    具体的软硬件实现点击http://mcu-ai.com/MCU-AI技术网页_MCU-AI 鸟叫声识别在鸟类保护中具有重要意义。通过适当的声音分类,研究可以自动预测该地区的生活质量。如今,深度学习
    发表于 05-30 20:30

    云知说话识别引擎获得HUAWEI COMPATIBLE证书及认证徽标的使用权

    继山海大模型获得两项华为昇腾技术认证后,近日,经华为综合评测,云知说话识别引擎成功通过与华为Atlas 800 推理服务器(型号:3000)、Atlas 300I Pro推理卡的相
    的头像 发表于 05-27 18:12 752次阅读
    云知<b class='flag-5'>声</b><b class='flag-5'>说话</b><b class='flag-5'>人</b><b class='flag-5'>识别</b>引擎获得HUAWEI COMPATIBLE证书及认证徽标的使用权