0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

腾讯混元大语言模型发布:超千亿参数规模

微云疏影 来源:综合整理 作者:综合整理 2023-09-08 10:38 次阅读

9月7日,腾讯正式发布自主研究通用语言模式“混元”。这一大型模型拥有超过一千亿个参数规模、超过两万亿的tokens训练过的语言资料、强大的汉语创作能力、复杂语言环境下的逻辑推理能力、可靠的业务执行能力。

根据官方说法,与chatgpt-3.5/4.0相比,混元大模型“幻觉”现象发生概率可减少30%-50%,同时也减少了与创作无关的描写。另外,对于安全诱导问题,可以将拒绝率提高20个百分点。

它还提供了长时间的文本生成功能,可以与插件结合生成4000个字符。产品具有更强的逻辑推理能力,可以结合实际场面进行推理决定。

腾讯表示,混元大模型已经对公司内部50多种产品和业务进行了内部测试。腾讯会议,腾讯文件,腾讯广告产品可以进入这个大模型。

当天,腾讯宣布,腾讯混元大模型也将通过腾讯云正式对外开放。用户可以直接调用api接口,或者使用混元作为基本模型,在公共云端进行精确的调整。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 腾讯
    +关注

    关注

    7

    文章

    1642

    浏览量

    49395
  • ChatGPT
    +关注

    关注

    29

    文章

    1548

    浏览量

    7471
  • 大模型
    +关注

    关注

    2

    文章

    2314

    浏览量

    2456
收藏 人收藏

    评论

    相关推荐

    腾讯Large模型及云TI平台全新上线

    近日,腾讯团队最新推出的MoE模型Large”已正式开源上线。这一里程碑式的进展标志着
    的头像 发表于 11-08 11:03 365次阅读

    高通与腾讯达成战略合作

    骁龙峰会期间,高通技术公司宣布与腾讯合作,基于骁龙8至尊版移动平台,共同推动了腾讯
    的头像 发表于 11-08 09:52 338次阅读

    腾讯发布开源MoE大语言模型Hunyuan-Large

    近日,腾讯公司宣布成功推出业界领先的开源MoE(Mixture of Experts,专家混合)大语言模型——Hunyuan-Large。这款模型不仅在
    的头像 发表于 11-06 10:57 251次阅读

    腾讯云推出全新大模型定价策略:免费并降低API费用

    他进一步表示,尽管传统搜索引擎已相当出色,但大模型却能使其更上一层楼。自去年9月腾讯推出大模型产品以来,模型效率已提升50%,参数
    的头像 发表于 05-30 15:20 635次阅读

    百度万象大会2024 聚焦智能体生态新进展

    同时,腾讯亦将推出大模型应用程序“元宝”,此乃基于其自研的模型,此前已通过网页和小程序形式发布
    的头像 发表于 05-30 11:08 469次阅读

    中国电信发布首个支持30种方言说语音大模型

    中国电信人工智能研究院(TeleAI)近日发布了一项引领业界的语音识别技术——星辰多方言语音识别大模型。这一模型突破性地支持30种方言的自由
    的头像 发表于 05-28 09:14 540次阅读

    腾讯器免费模型资源增至1亿tokens,模型全面降价

    腾讯方面获悉,一站式智能体创作与分发平台腾讯器即日起全面升级了模型资源扶持方案。
    的头像 发表于 05-27 14:22 749次阅读

    腾讯云大模型价格调整:-lite、-standard免费,-pro降价

    据了解,腾讯模型腾讯全链路自研的万亿参数模型
    的头像 发表于 05-23 17:05 758次阅读

    通义千问开源千亿参数模型

    通义千问近日开源了其首个千亿参数模型Qwen1.5-110B,这是其全系列中首个达到千亿级别的开源模型。Qwen1.5-110B模型继承了
    的头像 发表于 05-08 11:01 698次阅读

    【大语言模型:原理与工程实践】大语言模型的基础技术

    处理各种自然语言任务时都表现出了惊人的能力。这促使一个新的研究方向诞生——基于Transformer 的预训练语言模型。这类模型的核心思想是先利用大
    发表于 05-05 12:17

    【大语言模型:原理与工程实践】揭开大语言模型的面纱

    维基百科、网页内容和书籍等,不仅掌握了语言的语法、语义和上下文信息,还能生成结构连贯、语义合理的句子和段落。大语言模型的一个显著特点是其庞大的参数量,已达数亿甚至数十亿级别。这种
    发表于 05-04 23:55

    名单公布!【书籍评测活动NO.30】大规模语言模型:从理论到实践

    一阶段训练的奖励模型,对有监督微调模型对用户提示词补全结果的质量进行评估,与语言模型建模目标综合得到更好的效果。这一阶段的难点在于解决强化学习方法稳定性不高、
    发表于 03-11 15:16

    百川智能发布千亿模型Baichuan 3

    百川智能近日发布千亿参数的大语言模型Baichuan 3,引发了业界的广泛关注。这款
    的头像 发表于 01-31 14:58 792次阅读

    规模神经网络优化:参最佳实践与规模

    从理论分析入手把握大规模神经网络优化的规律,可以指导实践中的参数选择。反过来,实践中的参数选择也可以指导理论分析。本篇文章聚焦于大
    的头像 发表于 12-10 21:45 962次阅读

    规模语言模型的基本概念、发展历程和构建流程

    规模语言模型(Large Language Models,LLM),也称大规模语言模型或大型
    的头像 发表于 12-07 11:40 3724次阅读
    大<b class='flag-5'>规模</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>的基本概念、发展历程和构建流程