腾讯发布开源MoE大语言模型Hunyuan-Large-电子发烧友网

腾讯发布开源MoE大语言模型Hunyuan-Large

近日，腾讯公司宣布成功推出业界领先的开源MoE(Mixture of Experts，专家混合)大语言模型——Hunyuan-Large。这款模型不仅在参数量上刷新了业界纪录，更在效果上展现出了卓越的性能，标志着腾讯在自然语言处理领域迈出了重要的一步。

据了解，Hunyuan-Large的总参数量高达389B(即3890亿)，这一数字远超当前许多主流的大语言模型。而其激活参数也达到了惊人的52B(即520亿)，这意味着模型在处理复杂任务时能够展现出更强的学习能力和泛化性能。

除了参数量上的优势，Hunyuan-Large在训练数据上也下足了功夫。据悉，该模型训练时所使用的token数量达到了7T(即7万亿)，这确保了模型能够充分学习到语言的多样性和复杂性。同时，Hunyuan-Large还支持最大上下文长度为256K的文本输入，这一特性使得模型在处理长文本或对话场景时能够更准确地捕捉上下文信息，从而生成更加连贯和自然的回复。

腾讯此次推出的Hunyuan-Large大语言模型，不仅展示了其在人工智能领域的深厚技术积累，也为整个自然语言处理领域的发展注入了新的活力。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1796

文章
47643

浏览量
240022
腾讯

腾讯

+关注

关注
7

文章
1666

浏览量
49572
语言模型

语言模型

+关注

关注
0

文章
538

浏览量
10335
自然语言

自然语言

+关注

关注
1

文章
291

浏览量
13395

腾讯混元大模型开源成绩斐然，GitHub Star数近1.4万

内外部技术的开源共享，旨在促进技术创新与生态发展。据悉，腾讯混元大模型已经在多个模态上实现了开源，包括语言大

发表于 12-26 10:30 •270次阅读

大语言模型开发语言是什么

在人工智能领域，大语言模型（Large Language Models, LLMs）背后，离不开高效的开发语言和工具的支持。下面，AI部落小编为您介绍大

发表于 12-04 11:44 •220次阅读

猎户星空发布Orion-MoE 8×7B大模型及AI数据宝AirDS

近日，猎户星空携手聚云科技在北京共同举办了一场发布会。会上，猎户星空正式揭晓了其自主研发的Orion-MoE 8×7B大模型，并与聚云科技联合推出了基于该大模型的数据服务——AI数据宝

发表于 11-29 13:57 •283次阅读

腾讯混元Large模型及云TI平台全新上线

近日，腾讯混元团队最新推出的MoE模型“混元Large”已正式开源上线。这一里程碑式的进展标志着腾讯

发表于 11-08 11:03 •475次阅读

搭建开源大语言模型服务的方法

本文我们将总结5种搭建开源大语言模型服务的方法，每种都附带详细的操作步骤，以及各自的优缺点。

发表于 10-29 09:17 •256次阅读

Mistral Large 2现已在Amazon Bedrock中正式可用

北京2024年7月25日 /美通社/ -- 亚马逊云科技宣布，Mistral AI的Mistral Large 2（24.07）基础模型（FM）现已在Amazon Bedrock中正式可用

发表于 07-26 08:07 •368次阅读

昆仑万维开源2千亿稀疏大模型Skywork-MoE

近日，昆仑万维公司宣布开源一款名为Skywork-MoE的稀疏大模型，该模型拥有高达2千亿参数，不仅性能强劲，而且推理成本更低，为人工智能领域带来了新的突破。

发表于 06-04 14:44 •616次阅读

浪潮信息发布“源2.0-M32”开源大模型

浪潮信息近日推出了革命性的“源2.0-M32”开源大模型。该模型在源2.0系列基础上，引入了“基于注意力机制的门控网络”技术，构建了一个包含32个专家的混合专家模型（

发表于 05-29 09:08 •719次阅读

腾讯云大模型价格调整：混元-lite、混元-standard免费，混元-pro降价

据了解，腾讯混元大模型是腾讯全链路自研的万亿参数大模型，采用混合专家模型（MoE）结构，

发表于 05-23 17:05 •1005次阅读

红帽发布RHEL AI开发者预览版，集成IBM Granite模型，简化AI开发流程

RHEL AI依托InstructLab开源项目，结合IBM Research的开源授权Granite大型语言模型与InstructLab模型

发表于 05-08 15:01 •529次阅读

Mistral Large模型现已在Amazon Bedrock上正式可用

的 Mistral 7B 和 Mixtral 8x7B模型。今天，Mistral AI最新且最前沿的大语言模型（LLM）Mistral Large又在Amazon Bedrock上正式

发表于 04-08 16:26 •585次阅读

基于NVIDIA Megatron Core的MOE LLM实现和训练优化

本文将分享阿里云人工智能平台 PAI 团队与 NVIDIA Megatron-Core 团队在 MoE (Mixture of Experts) 大语言模型（LLM）实现与训练优化上的创新工作。

发表于 03-22 09:50 •866次阅读

Mistral发布Mistral Large旗舰模型，但没有开源

昨夜，被称为“法国版 OpenAI”的 Mistral AI 再放大招，正式发布 Mistral Large 旗舰模型，并且推出对标 ChatGPT 的对话产品：Le Chat，直接杀到 OpenAI 家门口。

发表于 02-27 13:34 •828次阅读

昆仑万维发布新版MoE大语言模型天工2.0

昆仑万维科技今日震撼发布全新升级的「天工2.0」MoE大语言模型以及配套的新版「天工AI智能助手」APP。此次更新标志着国内首个搭载MoE架

发表于 02-06 16:19 •1320次阅读

大模型开源开放评测体系司南正式发布

近日，大模型开源开放评测体系司南（OpenCompass2.0）正式发布，旨在为大语言模型、多模态模型

发表于 02-05 11:28 •1134次阅读

搜索历史

腾讯发布开源MoE大语言模型Hunyuan-Large

评论

腾讯混元大模型开源成绩斐然，GitHub Star数近1.4万

大语言模型开发语言是什么

猎户星空发布Orion-MoE 8×7B大模型及AI数据宝AirDS

腾讯混元Large模型及云TI平台全新上线

搭建开源大语言模型服务的方法

Mistral Large 2现已在Amazon Bedrock中正式可用

昆仑万维开源2千亿稀疏大模型Skywork-MoE

浪潮信息发布“源2.0-M32”开源大模型

腾讯云大模型价格调整：混元-lite、混元-standard免费，混元-pro降价

红帽发布RHEL AI开发者预览版，集成IBM Granite模型，简化AI开发流程

Mistral Large模型现已在Amazon Bedrock上正式可用

基于NVIDIA Megatron Core的MOE LLM实现和训练优化

Mistral发布Mistral Large旗舰模型，但没有开源

昆仑万维发布新版MoE大语言模型天工2.0

大模型开源开放评测体系司南正式发布