0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阶跃星辰发布国内首个千亿参数端到端语音大模型

科技绿洲 来源:网络整理 作者:网络整理 2024-12-17 13:43 次阅读

近日,阶跃星辰在官方公众号上宣布了一项重大突破——推出Step-1o千亿参数端到端语音大模型。该模型被誉为“国内首个千亿参数端到端语音大模型”,标志着我国在语音技术领域取得了新的里程碑。

据阶跃星辰介绍,传统的语音模型通常采用级联方案,即先将用户输入的语音信息转化为文本,再进行二次转化以生成语音输出。这种方案不仅过程繁琐,降低了传输效率,而且在转化过程中容易折损掉包括情绪在内的关键信息。这导致传统语音模型存在时延长、反应慢、回答质量和智能水平不足,以及情感表达空洞刻板等缺陷。

而阶跃星辰推出的Step-1o模型则采用了端到端的语音方案,实现了语音理解和生成的一体化。这一创新设计不仅提升了模型的智商上限,还使其能够更好地理解和表达情感,从而克服了传统语音模型的诸多缺陷。

Step-1o千亿参数端到端语音大模型的发布,不仅展示了阶跃星辰在语音技术领域的深厚实力,也为我国语音技术的发展注入了新的活力。未来,随着该模型的不断优化和应用推广,相信将为用户带来更加智能、高效和自然的语音交互体验。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音交互
    +关注

    关注

    3

    文章

    286

    浏览量

    27999
  • 大模型
    +关注

    关注

    2

    文章

    2407

    浏览量

    2621
收藏 人收藏

    评论

    相关推荐

    准确性超Moshi和GLM-4-Voice,语音双工模型Freeze-Omni

    GPT-4o 提供的全双工语音对话带来了一股研究热潮,目前诸多工作开始研究如何利用 LLM 来实现语音
    的头像 发表于 12-17 10:21 43次阅读
    准确性超Moshi和GLM-4-Voice,<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>语音</b>双工<b class='flag-5'>模型</b>Freeze-Omni

    讯飞星火模型发布

    参数量小、内存占比小的模型,正成为“兵家必争之地”。
    的头像 发表于 12-04 16:07 733次阅读

    黑芝麻智能算法参考模型公布

    黑芝麻智能计划推出支持华山及武当系列芯片的算法参考方案。该方案采用One Model架构,并在决策规划单元引入了VLM视觉语言大模型和PRR行车规则的概率化表征子模块,进一步提升
    的头像 发表于 12-03 12:30 261次阅读
    黑芝麻智能<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>算法参考<b class='flag-5'>模型</b>公布

    连接视觉语言大模型自动驾驶

    自动驾驶在大规模驾驶数据上训练,展现出很强的决策规划能力,但是面对复杂罕见的驾驶场景,依然存在局限性,这是因为
    的头像 发表于 11-07 15:15 206次阅读
    连接视觉语言大<b class='flag-5'>模型</b>与<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>自动驾驶

    InfiniBand网络解决LLM训练瓶颈

    的,这需要大量的计算资源和高速数据传输网络。InfiniBand(IB)网络作为高性能计算和AI模型训练的理想选择,发挥着重要作用。在本文中,我们将深入探讨大型语言
    的头像 发表于 10-23 11:26 363次阅读
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>InfiniBand网络解决LLM训练瓶颈

    智驾进程发力?小鹏、蔚来模型上车

    编者语: 「智驾最前沿」微信公众号后台回复: C-0546 ,获取本文参考文档:小鹏、蔚来模型上车,智驾拐点加速到来 pdf下载方式。 近年来,全球汽车行业正处于从传统燃油车向电
    的头像 发表于 09-26 09:19 263次阅读
    智驾进程发力?小鹏、蔚来<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>模型</b>上车

    循环神经网络在语音识别中的应用

    , LSTM)和门控循环单元(Gated Recurrent Unit, GRU)等,展现了强大的性能。本文将深入探讨循环神经网络在语音识别中的应用,包括其背景、核心算法原理、具
    的头像 发表于 07-08 11:09 559次阅读

    阶跃星辰发布重磅大模型新品,引领AI新纪元

    在万众瞩目的2024年世界人工智能大会上,阶跃星辰公司以其卓越的科研实力和创新能力,震撼发布了三款全新的Step系列通用大模型产品,标志着公司在人工智能领域的又一重大突破。
    的头像 发表于 07-05 16:13 556次阅读

    小鹏汽车发布国内首个量产上车的模型

    小鹏汽车近日宣布,国内首个模型量产上车,这一革命性的技术将大幅提升智能驾驶的能力。据小鹏
    的头像 发表于 05-28 11:47 704次阅读

    中国电信发布首个支持30种方言混说语音模型

    中国电信人工智能研究院(TeleAI)近日发布了一项引领业界的语音识别技术——星辰超多方言语音识别大模型。这一
    的头像 发表于 05-28 09:14 564次阅读

    小鹏汽车发布模型

    小鹏汽车近日宣布,其成功研发并发布了“国内首个量产上车”的
    的头像 发表于 05-21 15:09 671次阅读

    通义千问开源千亿参数模型

    通义千问近日开源了其首个千亿参数模型Qwen1.5-110B,这是其全系列中首个达到千亿级别的开源模型
    的头像 发表于 05-08 11:01 731次阅读

    理想汽车自动驾驶模型实现

    理想汽车在感知、跟踪、预测、决策和规划等方面都进行了模型化,最终实现了模型。这种模型不仅
    发表于 04-12 12:17 443次阅读
    理想汽车自动驾驶<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>模型</b>实现

    牵手NVIDIA 元戎启行模型将搭载 DRIVE Thor芯片

    NVIDIA的DRIVE Thor芯片适配公司的智能驾驶模型。据悉,元戎启行是业内首批能用 DRIVE Thor芯片适配
    发表于 03-25 11:49 327次阅读
    牵手NVIDIA 元戎启行<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>模型</b>将搭载 DRIVE Thor芯片

    模型卷入智驾圈 周光:今年上车!

    用人工智能技术的新纪元。目前,公司已经成功将模型适配到量产车上,该批量产车将于今年投入消费者市场。   元戎启行是国内第一家能够将
    发表于 03-18 11:17 520次阅读
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>模型</b>卷入智驾圈 周光:今年上车!