0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微信大模型扩容并开源,推出首个中英双语文生图模型,参数规模达15亿

微云疏影 来源:综合整理 作者:综合整理 2024-05-14 17:10 次阅读

腾讯于5月14日宣布将混元文生图大模型升级并公之于众,已发布至Hugging Face以及Github之上,包括模型权重、推理代码、模型算法等全方位数据,均向企业与个人开发者提供免费商业使用权限。

升级版混元文生图大模型采取了与Sora相同的DiT架构设计。腾讯强调,这是全球首个中英双语DiT架构。

基于Diffusion Transformer的混元DiT是一种文本到图像生成模块,具备中英细粒度理解能力,能与用户进行多轮对话,根据上下文生成并完善图像。

此外,它还是业界首个中文原生DiT架构文生图开源模型,支持中英文双语输入及理解,参数规模高达15亿。

运行该模型需配备支持CUDA的NVIDIA GPU,单次运行混元DiT所需最低显存为11GB;若要同时运行DialogGen(腾讯推出的文本转图像多模态交互式对话系统)和混元DiT,则至少需32GB显存。腾讯表示,他们已在Linux环境下对NVIDIA的V100和A100 GPU进行过测试。

国内首次官方“大模型标准符合性评测”结果出炉,腾讯混元大模型成功入选首批通过评测的国产大模型行列,其他通过评测的大模型还包括阿里通义千问、360智脑和百度文心一言。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4629

    浏览量

    93260
  • 图像
    +关注

    关注

    2

    文章

    1089

    浏览量

    40547
  • 大模型
    +关注

    关注

    2

    文章

    2544

    浏览量

    3068
收藏 人收藏

    评论

    相关推荐

    腾讯混元文生登顶智源FlagEval评测榜首

    榜首。 FlagEval作为智源研究院推出的大模型评测体系及开放平台,一直致力于评估基础模型及训练算法的性能。此次评测范围涵盖了国内外100余个开源和商业闭源
    的头像 发表于 12-25 10:06 274次阅读

    腾讯混元大模型上线开源文生视频能力

    近日,腾讯宣布其混元大模型正式上线,开源了一项令人瞩目的能力——文生视频。该大模型参数量高达1
    的头像 发表于 12-04 14:06 222次阅读

    AMD发布10亿参数开源AI模型OLMo

    AMD公司近日宣布了一项重大进展,推出首个完全开放的10亿参数语言模型系列——AMD OLMo。这一举措为开发者和研究人员提供了强大的AI
    的头像 发表于 11-12 18:08 490次阅读

    英伟震撼发布:全新AI模型参数规模跃升至80亿量级

    8月23日,英伟宣布,其全新AI模型面世,该模型参数规模高达80亿,具有精度高、计算效益大等优
    的头像 发表于 08-23 16:08 787次阅读

    阿里云推出首个域名AI大模型应用

    阿里云近日宣布其域名产品服务已全面完成AI化升级,并成功推出首个基于通义大模型的域名AI应用。此次升级不仅引入了“.ai”等40多个热门新域名后缀,还纳入了2000万个全球域名资源,极大地丰富了用户的注册选择。
    的头像 发表于 08-09 14:55 563次阅读

    Al大模型机器人

    )大模型AI机器人采用中英双语应用,目前的知识图谱包括了金航标和萨科所有的产品内容、应用场景、产品的家属参数等,热卖的型号S8050、T
    发表于 07-05 08:52

    快手自研文生模型“可”开放,支持AI图像创作及定制

    5月30日最新动态,快手于近日向公众推出其自主研发的文生模型命名为“可”。该模型具备
    的头像 发表于 05-31 10:32 694次阅读

    谷歌发布AI文生模型Imagen

    近日,谷歌在人工智能领域取得新突破,正式推出了Imagen文生模型。这款模型以其卓越的细节调整功能、逼真的光线效果以及从草图快速生成高分辨
    的头像 发表于 05-16 09:30 574次阅读

    通义千问开源千亿级参数模型

    通义千问近日开源了其首个千亿级参数模型Qwen1.5-110B,这是其全系列中首个达到千亿级别的开源模型
    的头像 发表于 05-08 11:01 780次阅读

    通义千问推出1100亿参数开源模型

    通义千问近日震撼发布1100亿参数开源模型Qwen1.5-110B,这一举措标志着通义千问在AI领域迈出了重大步伐。该模型成为通义千问全系
    的头像 发表于 05-06 10:49 619次阅读

    【大语言模型:原理与工程实践】揭开大语言模型的面纱

    维基百科、网页内容和书籍等,不仅掌握了语言的语法、语义和上下文信息,还能生成结构连贯、语义合理的句子和段落。大语言模型的一个显著特点是其庞大的参数量,已达数亿甚至数十亿级别。这种规模
    发表于 05-04 23:55

    Meta推出最强开源模型Llama 3 要挑战GPT

    公司这次开源了Llama 3 8B与70B两款不同规模模型,开发者可以免费使用,而Meta公司还将陆续推出一系列具备多模态、多语言对话、更长上下文窗口等能力的新
    的头像 发表于 04-19 17:00 882次阅读

    OpenAI文生视频模型Sora要点分析

    近日,美国人工智能公司OpenAI发布了首个视频生成模型Sora。不同于此前许多AI大模型文生或视频时,会出现人物形象前后不一致等问题
    的头像 发表于 02-22 16:37 1150次阅读
    OpenAI<b class='flag-5'>文生</b>视频<b class='flag-5'>模型</b>Sora要点分析

    英伟市值跃居全球第四 文生视频大模型Sora带动

    英伟市值跃居全球第四 文生视频大模型Sora带动 文生视频大模型Sora引发市场关注;OpenAI的首款
    的头像 发表于 02-19 16:48 1031次阅读

    奥特曼发布王炸模型Sora OpenAI首个文生视频模型Sora正式亮相

    奥特曼发布王炸模型Sora OpenAI首个文生视频模型Sora正式亮相 2月16日凌晨OpenAI的首个
    的头像 发表于 02-18 17:41 1031次阅读