“百模大战”：盘点国内外横空出世的AI大模型-电子发烧友网

所谓AI大模型就是人工智能预训练模型，包含三大要素：大算力、强算法、大数据。大模型相当于人工智能的土壤，没有大模型支持，就不会有AI的成功。

AI大模型战场上，国外的OpenAI、谷歌、微软等大厂正打得火热；国内以百度、阿里、华为、腾讯为代表的科技巨头，科大讯飞、智谱AI、商汤科技等AI公司，三大运营商，以及智源研究院、中科院等学术/研究机构都纷纷投身AI大模型浪潮。

从全球已经发布的大模型分布来看，中美两国数量合计占全球总数的超 80%，美国在大模型数量方面居全球之首。有专家披露，据不完全统计，目前中国 10 亿参数规模以上的大模型已发布 79 个。

下面一起看看在“百模大战”下，有哪些横空出世的AI大模型！

国内战场

百度：文心大模型

2017年，在百度首届AI开发者大会上，百度喊出了“All in AI”口号，随后围绕着AI进行了技术研发投入。得益于在人工智能领域的长期投入，百度在人工智能四层架构，也就是“芯片层、框架层、模型层、应用层”有着全栈的布局。

在芯片层，百度昆仑芯科技已实现两代通用 AI芯片“昆仑”的量产及应用，为大模型落地提供强大算力支持。

在框架层，“飞桨”是国内首个自主研发的产业级深度学习平台，集基础模型库、端到端开发套件和工具组件于一体，有效支持文心大模型高效、稳定训练。

在模型层，“文心大模型”包括基础大模型、任务大模型、行业大模型三级体系，全面满足产业应用需求。

在应用层，文心已大规模应用于百度自有业务的各类产品，并通过企业级平台“文心千帆”进一步推动生态构建。

文心大模型包括 NLP 大模型、CV 大模型、跨模态大模型、生物计算大模型和行业大模型。目前，文心大模型已经迭代至3.5版本，与3.0版本相比，训练速度提升了2倍，推理速度提升了17倍，模型效果累计提升超过50%。据百度官方表示，文心一言大模型的训练数据包括了万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据，以及5500亿事实的知识图谱等。

腾讯：混元大模型

基于腾讯强大的底层算力和低成本的高速网络基础设施，2022 年底腾讯发布了低成本、可落地的NLP万亿大模型——混元（HunYuan）AI 大模型。

混元AI大模型采用腾讯太极机器学习平台自研的训练框架AngelPTM，相比业界主流的解决方案，太极AngelPTM单机可容纳的模型可达55B，20个节点（A100-40Gx8）可容纳万亿规模模型，节省45%训练资源，并在此基础上训练速度提升1倍！

在模型层，混元大模型完整覆盖 NLP 大模型、 CV 大模型、多模态大模型、文生图大模型及众多行业/领域/任务模型。其中，HunYuan-NLP 1T 的模型能力在自然语言理解任务榜单 CLUE 中登顶。

| 混元大模型全景图

在产业化方面，混元先后支持了包括微信、QQ、游戏、腾讯广告、腾讯云等众多产品和业务，通过 NLP、CV、跨模态等 AI 大模型，不仅为业务创造了增量价值而且降低了使用成本。特别是其在广告内容理解、行业特征挖掘、文案创意生成等方面的应用，在为腾讯广告带来大幅 GMV 提升的同时，也初步验证了大模型的商业化潜力。

阿里：通义大模型

2022年9月，阿里达摩院发布通义大模型系列。该模型打造了AI统一底座，并构建了通用与专业模型协同的层次化人工智能体系，首次实现模态表示、任务表示、模型结构的统一。通义大模型整体架构分为三个层次：

模型底座层：多模态统一底座模型 M6-OFA，实现统一的学习范式和模块化设计；

通用模型层：多模态模型“通义-M6”、NLP 模型“通义-AliceMind”以及 CV 模型“通义-视觉”；

行业模型层：深入电商、医疗、法律、金融、娱乐等行业。

通过部署超大模型的轻量化及专业模型版本，通义大模型已在超过 200 个场景中提供服务，实现 2%～10%的应用效果提升。在搜索场景中，可实现以文搜图的跨模态搜索。在 AI 辅助审判中，可实现司法卷宗的事件抽取、文书分类等任务效果 3～5%的提升。在人机对话领域，初步具备知识、记忆、情感以及个性的中文开放域对话大模型可实现主动对话、广泛话题、紧跟热点等对话体验。此外，通义大模型在 AI 辅助设计、医疗文本理解等其他领域也有丰富的应用场景。

在近期的2023世界人工智能大会上，阿里宣布推出通义大模型家族新成员“通义万相”。这是一款AI绘画模型，支持文生图等功能，它能够通过机器学习和自然语言处理技术，从文本描述中生成对应的图片或画作。

华为：盘古大模型

2021年4月华为正式发布盘古系列大模型，包括NLP、CV和科学计算大模型，后续还发布了矿山、药物分子、气象、海浪等行业大模型。

其中，盘古NLP大模型首次使用Encoder-Decoder架构，兼顾NLP大模型的理解能力和生成能力，保证了模型在不同系统中的嵌入灵活性。在下游应用中，仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配。而盘古CV大模型则是首次实现模型按需抽取的业界最大CV大模型，兼顾判别与生成能力，能够基于模型大小和运行速度需求，自适应抽取不同规模模型，AI应用开发快速落地。

在7月7日的华为开发者大会2023上，盘古大模型3.0正式发布。盘古大模型 3.0 是一个完全面向行业的大模型系列，包括 5+N+X 三层架构：

L0 基础大模型：包括自然语言大模型、视觉大模型、多模态大模型、预测大模型、科学计算大模型在内的5个基础大模型。盘古 3.0 为客户提供 100 亿参数、380 亿参数、710 参数和 1000 亿参数的系列化基础大模型，匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。

L1 行业大模型：涵盖N 个行业大模型，既可以提供使用行业公开数据训练的行业通用大模型，包括政务，金融，制造，矿山，气象等；也可以基于行业客户的自有数据，在盘古的 L0 和 L1 上，为客户训练自己的专有大模型。

L2 场景模型：为客户提供更多细化场景，它更加专注于某个具体的应用场景或特定业务，为客户提供开箱即用的模型服务。

网易：玉言、子曰大模型

在2023世界人工智能大会上，网易多款AI大模型落地产品首次亮相，集中展示了在人工智能基础设施层、引擎层、平台层、模型层、应用层的领先创新成果。会上，由网易有道自研的首个教育大模型“子曰”最新应用成果——虚拟人口语教练首次亮相。

除了口语训练外，据悉“子曰”大模型系列应用成果还包括中文作文指导与批改、英语习题精讲等多种教育领域细分应用。“子曰”大模型能够作为基座模型支持很多下游任务，为所有下游场景模型提供语义理解、知识表达等基础能力，是有道AI产品体系的核心。有道研发团队在子曰大模型的基础上，会为不同场景设计定制化模型，以实现模型与场景的高度契合。

此前网易伏羲实验室推出了中文预训练大模型“玉言”。公开资料显示，“玉言”大模型参数达到110亿，由浪潮信息提供AI算力支持。“玉言”大模型相关技术已用于网易集团内的文字游戏、智能 NPC、文本辅助创作、音乐辅助创作、美术设计、互联网搜索推荐等业务场景。

据了解，网易AI大模型正在加速覆盖百余个产业应用场景，在加速创新应用的同时，网易伏羲有灵众包平台今年还将为10万人提供AI新职业，包含挖掘机远程驾驶员、AI绘画师、AI表情绑定师等人机协作的就业岗位。平台还会根据求职者的用户画像，提供针对性的培训，帮助他们实现能力和收入的提升。

京东：言犀大模型

京东集团技术委员会主席、京东云事业部总裁曹鹏介绍，即将推出的言犀大规模预训练语言模型将面向多模态，深入零售、物流、工业等产业场景。言犀是“京东版”ChatGPT，其预训练参数达到千亿级、品类覆盖 3000+、人工审核通过率95%+、生成文字30亿+。

据悉，新一代京东大模型定位于产业版本的ChatGPT。该模型的落地应用路线图“125”计划也已公布，包括一个平台、两个领域和五个应用。其中，一个平台为ChatJD智能人机对话平台，两个领域为零售和金融，五个应用则包括内容生成、人机对话、用户意图理解、信息抽取和情感分类。

360：360智脑大模型

6月13日，360集团举行360智脑大模型应用发布会，认知型通用大模型“360智脑4.0”亮相，360智脑在多模态等关键能力上完成迭代，将全面接入“360全家桶”，同时360AI数字人正式发布。

360集团创始人周鸿祎介绍，认知型通用大模型“360智脑4.0”具备生成与创作、多轮对话、代码能力、逻辑与推理、知识问答、阅读理解、文本分类、翻译、文本改写、多模态（文本生成图像）十大核心能力。

周鸿祎表示，今年3月底，360智脑大模型率先落地搜索场景。在随后不到3个月时间内，360智脑完成从1.0版本到4.0版本的迭代。下一步，计划将360智脑升级到5.0版本，并发布插件平台。

浪潮：源大模型

源1.0是浪潮信息在2021年发布的人工智能巨量模型，单体模型参数量达到2457亿。作为通用NLP预训练模型，源1.0能够适应多种类的AI任务需求，降低针对不同应用场景的语言模型适配难度，并提升小样本学习与零样本学习场景的模型泛化应用能力。

此后，浪潮信息发布了基于“源1.0”大模型生成的4个技能大模型（SkillModel），分别为对话模型“源晓问”、问答模型“源晓搜”、翻译模型“源晓译”、古文模型“源晓文”。这些技能大模型在各自细分领域的精度业界领先，可直接应用于人机交互、知识检索、语言翻译和文学创作等领域，模型运行速度最高提升9倍。更重要的是，基于大模型快速生成特定领域的技能大模型（Skill Model），也意味着“源”的AI生产力大幅升级，能够帮助商业组织和研究机构实现对AI技术的高效、快速和低成本应用，加速产业AI化。

浪潮表示，公司在“源”大模型方面的工作在持续推进中。源2.0将会在文生图、Chat、多模态、工具链等方面进行升级提升。

科大讯飞：星火认知大模型

在多年核心技术储备下，科大讯飞于2022年12月15日启动“1+N”认知智能大模型专项攻关，2023年5月6日讯飞星火认知大模型正式发布，涵盖了文本生成、语言理解、知识问答、逻辑推理等七项核心能力，并持续迭代于6月9日再次升级发布星火认知大模型V1.5。

星火认知大模型最先应用于教育、办公、汽车驾驶、数字员工等场景，升级产品智能化功能，极大程度改善了用户体验。

在教育领域，讯飞星火认知大模型+学习机（科大讯飞AI习机T20），可以AI写作批改、精细批改、给优化参考，俨然成为学生的智能家庭教师。在办公领域，讯飞星火大模型+办公（讯飞听见、讯飞智能办公本X2），可以自动会议纪要、自动语篇规整、一键成稿，是职工的智能办公助理。

在汽车驾驶领域，讯飞星火认知大模型+智能座舱，可以提供多轮、多人、多区域、多模态智能汽车人机交互范式，强化智能座舱的科技体验感。在数字员工领域，讯飞星火大模型+数字员工，优化了数字员工语音和文本交互体验……

近日，科大讯飞高级副总裁、认知智能全国重点实验室主任胡国平公布了讯飞与华为的合作，表示讯飞星火将与昇腾AI强强联合，全力打造我国通用智能新底座。“国产大模型只有基于中国自主创新的算力底座才有大未来。”

商汤：日日新大模型

4月，商汤科技董事长兼首席执行官徐立宣布推出“日日新SenseNova”大模型体系。这个体系包含自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。

近日，“商汤日日新SenseNova”大模型体系多方位全面升级。作为千亿级参数的自然语言处理模型，商汤商量SenseChat 2.0版本突破了大语言模型输入长度的限制，并推出不同参数量级的模型版本，可完美适配移动端、云端等不同终端及场景的应用需求，降低部署成本。商汤的自研生成式大模型商汤秒画SenseMirage 3.0的模型参数从今年4月首次发布以来的10亿提升至70亿量级，能够实现专业摄影级的图片细节刻画。

商汤如影SenseAvatar 2.0数字人生成平台相较1.0版本的语音和口型流畅度提升30%以上，实现4K高清视频效果，并带来AIGC生成形象及数字人歌唱功能。此外，商汤琼宇SenseSpace 2.0的空间重建效率提升20%，渲染性能提升50%，每100平方公里场景的建图时间仅需38小时即可完成（1200 TFLOPS/秒算力支持）；而商汤格物SenseThings 2.0对小物体的纹理及材质还原达到毫米级精细度，并突破对高反光和镜面物体的采集难题。

智谱AI：智谱AI系列大模型

2022年 11月，斯坦福大学大模型中心对全球 30 个主流大模型进行全方位评测，智谱 AI研发的双语千亿级超大规模预训练模型 GLM-130B 是亚洲唯一入选的大模型，测评结果显示，其准确性等关键指标与 OpenAI、谷歌大脑、微软和英伟达等公司的大模型接近或持平，全球已有70个国家 1000 余家机构申请使用。

智谱AI语言大模型ChatGLM系列模型，通过注入代码预训练，有监督微调等技术对齐人类意图，具备问答、多轮对话、代码生成等能力；代码大模型CodeGeeX模型，130亿参数，支持20多种编程语言，具备代码生成、续写、翻译等能力；多模态大模型CogView模型，基于Transformer架构的文本生成图像模型，支持根据指令生成和编辑图像。

ChatGLM 在GLM-130B 上通过有监督微调等技术实现人类意图对齐，支持英伟达和华为异腾、海光及申威等***进行训练和推理，开源的ChatGLM-6B 模型全球下载超过 160万，持续两周位列Huggingface 全球模型趋势榜榜首。

据360官方消息，360 和智谱 AI 达成战略合作，打造中国的“微软+OpenAI”组合引领大模型技术攻关，共同研发的千亿级大模型“360GLM”。

昆仑万维：天工大模型

4月10日，昆仑万维宣布联合奇点智源共同研发了号称“中国第一个真正实现智能涌现”的国产大语言模型——“天工”3.5。

天工作为一款大型语言模型，拥有强大的自然语言处理和智能交互能力，能够实现智能问答、聊天互动、文本生成等多种应用场景，并且具有丰富的知识储备，涵盖科学、技术、文化、艺术、历史等领域。

据悉，天工算力基于国内最大的GPU集群之一，其规模优势使得天工可通过海量数据进行更充分的训练，从而积累更强的理解能力和记忆力。其次，天工采用了双千亿模型——千亿预训练基座模型和千亿RLHF模型，这使其具备了更高级的自主学习和智能涌现能力。此外，蒙特卡洛搜索树算法使天工可以提供更加人性化的交互体验。这些技术突破，使得天工在复杂任务和场景中能够快速且准确地响应指令，输出高质量回答。

中国移动：“九天”1+N大模型

2023 年7 月 8 日，中国移动正式发布 “ 九天 ” 人工智能大模型：九天・海算政务大模型和九天・客服大模型。目前，九天人工智能平台的技术团队拥有超过600名研发人员。

据了解，九天・海算政务大模型具备政务事项理解能力、多维度信息关联能力、面向复杂事项和复杂流程的多元交互能力，首创 “ 政务大模型 — 信息场 — 应用 ” 端到端政务服务体系，可以满足工作人员动态管理、公文写作等需求。

九天・客服大模型可根据用户提供的自然语言描述，解析问题并提供答案；还可与人工客服协作，分析历史沟通内容的语义和上下文，总结和归纳对话的重点和关键信息，为人工客服提供回复建议。

中国电信：TeleChat大模型

7月6日，中国电信数字智能科技分公司正式对外发布中国电信大语言模型TeleChat，并展示了大模型赋能数据中台、智能客服和智慧政务三个方向的产品。

中国电信依托云网融合的优势，打造了中国电信的大语言模型TeleChat。TeleChat使用了大量高质量中英文语料进行预训练，并采用了千万级问答数据进行微调。同时，设计了渐进膨胀注意力机制，用于增加模型的间隔采样，扩大实际感受野；研发了自校准微调技术，将迭代后相关性偏差作为强化学习的监督信号，提升强化学习效果；并且利用知识图谱协同增强策略，通过知识图谱增强大模型的预训练和推理能力，减少大模型幻觉现象。

此外，以TeleChat为底座的教育版大模型TeleChat-E在全球大模型综合性考试评测榜单C-Eval上排名第七，前几名包括ChatGPT等知名大模型。TeleChat-E使用人工收集、标注、整理的高质量领域数据对TeleChat进行持续效果强化。同时，TeleChat-E对Transformer Decoder的损失函数进行改进，使之更加关注题目答案的生成，提高准确率。

当下，电信TeleChat大模型正在与千行百业的信息化解决方案进行融合，在诸多行业实现商业化落地。

中国联通：鸿湖图文大模型1.0

近日，在上海世界移动通信大会期间，中国联通发布了一项重要的技术创新成果——鸿湖图文大模型1.0。中国联通称，鸿湖图文大模型是首个面向运营商增值业务的大模型。

据了解，鸿湖图文大模型目前有两个版本，分别是拥有8亿训练参数和20亿训练参数的版本。这意味着该大模型具备了强大的计算和学习能力，能够实现多种复杂的图文处理功能。

以文生图是鸿湖图文大模型的一项重要功能。通过该功能，用户可以输入文字描述，大模型能够自动生成相应的图像。这对于一些需要图像辅助的场景，如广告设计、创意表达等，具有重要的应用价值。

另外，鸿湖图文大模型还具备视频剪辑和以图生图的功能。视频剪辑功能可以根据用户提供的视频素材，自动进行剪辑和编辑，生成符合用户需求的视频作品。而以图生图功能则可以根据用户提供的图像，生成新的图像，为用户提供更多的创作灵感。

中国科学院自动化研究所：紫东太初大模型

紫东太初是中国科学院自动化研究所研发的跨模态通用人工智能平台，首次发布于 2021 年 7 月。紫东太初是图文音（视觉-文本-语音）三模态预训练模型（OPT-Omni-Perception pre-Trainer），同时具备跨模态理解与跨模态生成能力。

2023年6月16日，中国科学院自动化研究所发布紫东太初2.0。相比1.0版本，在语音、图像和文本三模态的基础上，加入视频、传感信号、3D点云等模态数据，研究突破了认知增强的多模态关联等关键技术，具备全模态理解能力、生成能力和关联能力，面向数字经济时代加速通用人工智能的实现。

紫东太初 2.0以自动化所自研算法为核心，以昇腾AI硬件及昇思MindSpore AI框架为基础，依托武汉人工智能计算中心算力支持，着力打造全栈国产化通用人工智能底座。长期以来，强大的算力支撑是约束我国人工智能发展的瓶颈之一，此举将有力推动国产基础软硬件与大模型技术的适配，协同构建我国通用人工智能自主可控发展生态。

目前，“紫东太初”大模型已在神经外科手术导航、短视频内容审核、法律咨询、医疗多模态鉴别诊断、交通违规图像研读等领域开始了一系列应用。

智源研究院：悟道智能模型

智源研究院自 2020 年 10 月正式启动超大规模智能模型悟道项目，2021 年3月2号就发布了超大规模的智能模型悟道1.0，取得了多项领域的领先突破。2021年6月1日，基于智能模型“悟道2.0”诞生的原创虚拟学生“华智冰”在北京正式亮相。

悟道2.0智能模型参数规模达到1.75万亿个，可以同时处理中英文和图片数据。该模型还引入大规模的知识图谱，构建了数据与知识双轮驱动的人工智能框架，并通过这种框架分析、理解富含前沿技术信息的知识。

2023年 6 月的智源大会上，智源发布并全面开源“悟道3.0”系列模型。值得注意的是，智源的关注点不仅是模型本身，更包括模型背后的算力平台建设、数据梳理、模型能力评测、算法测试、开源开放组织等体系化工作。

“悟道3.0 ”包括“悟道·天鹰”（Aquila）语言大模型系列、“悟道 · 视界”视觉大模型系列，以及一系列多模态模型成果。

国外战场

OpenAI：GPT 系列大模型

2022 年11月，OpenAI发布了名为ChatGPT的人工智能模型并迅速引爆人工智能市场，推动国内公司进入生成式人工智能领域，导致市场竞争激烈。OpenAI GPT 系列大模型基于 Transformer 基础模型，GPT（Generative Pre-trained Transformer）即生成式预训练 Transformer模型，模型被设计为对输入的单词进行理解和响应并生成新单词，预训练代表着 GPT 通过填空方法来对文本进行训练。

GPT-4 是 OpenAI 在深度学习扩展方面的最新里程碑。根据微软发布的GPT-4 论文，GPT-4 已经可被视为一个通用人工智能的早期版本。GPT-4 是一个大型多模态模型（接受图像和文本输入、输出），虽然在许多现实场景中的能力不如人类，但在各种专业和学术基准测试中表现出人类水平的性能。GPT-4 不仅在文学、医学、法律、数学、物理科学和程序设计等不同领域表现出高度熟练程度，而且它还能够将多个领域的技能和概念统一起来，并能理解其复杂概念。

2023 年 6 月，OpenAI对外公布了一种新的AI模型训练方法，旨在解决“AI幻觉”的问题。所谓“AI幻觉”，指的是聊天机器人用编造的信息进行回应，这是AI自信反应的一种表现。ChatGPT、谷歌 Bard都存在 AI 幻觉问题。OpenAI研究人员在报道中写道：“即使是最先进的模型也很容易生成虚假信息——在不确定情况时，它们往往表现出捏造事实的倾向。这种幻觉在需要多步推理的领域尤其严重，其中一个环节上的逻辑错误就足以破坏整个解答过程。”

微软：Orca大模型等

2019 年微软首次注资 OpenAI后，双方开始在微软的 Azure 云计算服务上合作开发人工智能超级计算技术，同时 OpenAI 逐渐将云计算服务从谷歌云迁移到 Azure。2023 年 3月起，微软开始全面集成GPT- 4，包括Office 全家桶、Windows、Bing 等等。

2022 年 8 月，微软亚洲研究院联合微软图灵团队推出了最新升级的 BEiT-3 预训练模型，在广泛的视觉及视觉-语言任务上，包括目标检测（COCO）、实例分割（COCO）、语义分割（ADE20K）、图像分类（ImageNet）、视觉推理（NLVR2）、视觉问答（VQAv2）、图片描述生成（COCO）和跨模态检索（Flickr30K，COCO）等，实现了 SOTA 的迁移性能。

2023 年6 月，微软 AI 推出 Orca，这是一个拥有 130 亿个参数的AI模型，可以从 GPT-4 中学习复杂的解释轨迹和逐步的思维过程。这种创新方法显著提高了现有最先进的指令调整模型的性能，解决了与任务多样性、查询复杂性和数据扩展相关的挑战。Orca 语言模型可以针对特定任务进行优化，并使用 GPT-4 等大型语言模型进行训练。由于其尺寸较小，Orca 运行和操作所需的计算资源较少。研究人员可以根据自己的需求优化模型并独立运行，无需依赖大型数据中心。

微软正在利用大规模和多样化的模仿数据来促进 Orca 的渐进式学习，Orca 在 Big-Bench Hard （BBH）等复杂的零样本推理基准测试中已经 100% 超过了 Vicuna。

谷歌：PaLM 2 大模型、Gemini大模型等

谷歌最早在 2017 年提出 Transformer 网络结构，成为了过去数年该领域大多数行业进展的基础。随后在 2018 年，谷歌提出的 BERT 模型，在 11 个 NLP 领域的任务上都刷新了以往的记录。基于 Transformer 结构，谷歌于 2019 年推出大模型——T5（Text-toText Transfer Transformer）

在ChatGPT 取得突破性成功之后，谷歌宣布了自己的聊天机器人谷歌 Bard，而 Bard 这个技术形象背后是 LaMDA 在提供后端支撑。LaMDA 是继 BERT之后，谷歌于 2021 年推出的一款自然对话应用的语言模型。同年谷歌研发出 GLaM 模型架构，GLaM 也是混合专家模型（MoE），其在多个小样本学习任务上取得有竞争力的性能。

2022 年，Google 发布了 Pathways AI 架构的大模型（Pathways Language Model），简称为 PaLM），2023 年5 月，谷歌在Google I/O 开发者大会上发布了升级款 PaLM 2 ，PaLM 2 同时提供了四种模型大小的版本分别是：壁虎（Gecko）、水獭（Otter）、野牛（Bison）和独角兽（Unicorn）。据谷歌介绍，PaLM 2 具有改进的多语言能力，在训练模型时加入了 100 多种语言的语料来，促使 PaLM 2 在理解、生成和翻译细微差别的文本（如成语、诗歌和谜语）的能力上相比前代有着显著提高。同时在推理方面，PaLM 2 的数据集在理解科学论文以及数学表达式等问题时也有着巨大提升。

6月28日消息，谷歌正准备推出全新的AI大模型Gemini。谷歌旗下DeepMind CEO戴密斯·哈萨比斯最近在采访中进一步透露了Gemini的细节，Gemini会将AlphaGo与GPT-4等大模型的语言功能合并，目标是让系统具有新的能力，如规划或解决问题，比OpenAI的GPT-4能力更强。不过Gemini还在开发中，这个过程预计需要几个月的时间。

Meta：LLaMA语言模型、ImageBind 大模型等

继微软、谷歌之后，Facebook母公司Meta也加入AI军备竞赛。2023 年2月24日，Meta官网公布了一款新的人工智能大型语言模型LLaMA，从参数规模来看，Meta提供有70亿、130亿、330亿和650亿四种参数规模的LLaMA模型，并用20种语言进行训练。

2023 年 5 月，Meta 发布 650亿参数语言模型 LIMA，仅在 1000 个精心挑选的样本上微调 LLaMa-65B 且无需 RLHF，就实现了与 GPT-4 和 Bard 相媲美的性能。此外，Meta还推出了大规模多语言语音项目 MMS（Massively Multilingual Speech）、可“任意图像分割”的基础模型SAM（Segment Anything Model）、DINOv2 视觉大模型。

同样在 5 月，Meta开源 ImageBind 新模型，ImageBind大模型以视觉为核心，结合文本、声音、深度、热量（红外辐射）、运动（惯性传感器），最终可以做到6个模态之间任意的理解和转换。ImageBind 可以使用文本、音频和图像的组合来搜索照片、视频、音频文件或文本消息。ImageBind 用于丰富的多媒体搜索、虚拟现实甚至机器人技术，可以和 Meta 内部的虚拟现实、混合现实和元宇宙等技术相结合。

AWS：Titan语言大模型

2023 年 4 月，AWS 正式入局 AIGC，推出自有基础模型 Titan 和 AIGC 服务 Bedrock，以及 AI 编程助手 Amazon CodeWhisperer，并宣布基于自研推理和训练 AI 芯片的最新实例 Amazon EC2 Trn1n 和 Amazon EC2 Inf2 正式可用。

AWS 推出的自研语言大模型 Titan分为两种，一种是针对总结、文本生成（如原创博客）、分类、开放式问答和信息提取等任务的生成式大语言模型。另一种是文本嵌入（embeddings）大语言模型，能够将文本输入（字词、短语甚至是大篇幅文章）翻译成包含语义的数字表达（即embeddings 嵌入编码）。AWS表示，除了这两个以外，未来还会有一系列模型都隶属于Amazon Titan家族。

除了大模型，同时发的还有新的训练和推理实例，一个面向开发者的AI编程工具Amazon CodeWhisperer，还有用于托管和开发生成式AI应用的Amazon Bedrock。四箭齐发，亚马逊云科技抢占大模型市场机遇。

在大模型快速演进的关键时期，为方便技术交流，共促产业发展。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
30996

浏览量
269292
大数据

大数据

+关注

关注
64

文章
8894

浏览量
137480
大模型

大模型

+关注

关注
2

文章
2476

浏览量
2794
AI大模型

AI大模型

+关注

关注
0

文章
316

浏览量
312

原文标题：“百模大战”：盘点国内外横空出世的AI大模型

文章出处：【微信号：SDNLAB，微信公众号：SDNLAB】欢迎添加关注！文章转载请注明出处。

2024年智慧路灯国内外应用案例（节选）智慧路灯案例

2024年智慧路灯国内外应用案例（节选）智慧路灯案例

发表于 01-03 10:06 •40次阅读

2024年智慧路灯<b class='flag-5'>国内外</b>应用案例（节选）智慧路灯案例

【「大模型启示录」阅读体验】+开启智能时代的新钥匙

那些拥有数十亿甚至数千亿参数的大规模模型成为了现实可能。Transformer 等机制模型架构的横空出世，彻底改变了模型训练的效率和性能。我有时在想国外为何能够在大

发表于 12-24 13:10

国产大模型发展的经验与教训

本文介绍大模型的计算特征（国产平台介绍、系统挑战、算子实现、容错）、框架的并行性支持、未来算法等。随着ChatGPT的横空出世，人工智能大模型成为各行各业热议的焦点，国内外各

发表于 11-11 11:39 •255次阅读

反制无人机的技术进展：国内外先进系统与技术概览

随着无人机技术的快速发展和广泛应用，无人机带来的潜在威胁也日益凸显。为了应对这些威胁，反制无人机技术成为了国内外关注的焦点。本文特信无人机反制小编将概述当前国内外在反制无人机技术方面的先进系统和技术。

发表于 06-27 09:07 •737次阅读

反制无人机的技术进展：<b class='flag-5'>国内外</b>先进系统与技术概览

百度文心大模型日处理Tokens文本已达2490亿

近日，国内外AI领域迎来新一轮技术革新。百度作为行业领军者，率先发布了大模型的最新进展及相关应用。百度指出，闭源大

发表于 05-16 10:08 •417次阅读

STM32国内外发展现状

电子发烧友网站提供《STM32国内外发展现状.docx》资料免费下载

发表于 04-08 15:56 •37次下载

当家居营销遇上AI，2024家居行业AI营销第一课（成都站）火热报名中

2022年末，OpenAI的ChatGPT聊天机器人横空出世并迅速破圈走红，其出色的表现让很多人体验到了人工智能内容生成AIGC所带来的愉悦与便捷。在随后的一年多，众多国内外厂商纷纷跟进，相继发布

发表于 04-07 17:24 •325次阅读

当家居营销遇上<b class='flag-5'>AI</b>，2024家居行业<b class='flag-5'>AI</b>营销第一课（成都站）火热报名中

“百模大战”竞争格局报告发布，云天天书大模型入选典型案例

3月24日，在2024全球开发者大会“百模大战”商业发展讲坛上,亿欧智库正式发布《2024中国“百模大战

发表于 03-26 14:01 •536次阅读

火了这么久的大模型，到底能为模组产业带来什么？

全球新一轮产业技术变革加速来临，大模型作为人工智能发展的核心引擎，正引发一场全新的工业革命，可能彻底改变人类社会的生产和生活方式。▌大模型：从横空出世到百花齐放回顾上一年度，ChatG

发表于 03-15 17:34 •654次阅读

针对高速光模块应用，小华半导体推出HC32F472系列模拟丰富MCU新品

2023年以来，生成式人工智能ChatGPT及横空出世的视频生成模型Sora极大地影响人类科技发展的方向。

发表于 03-15 17:28 •1335次阅读

新火种AI|秒杀GPT-4，狙杀GPT-5，横空出世的Claude 3振奋人心！

2024年第一季度才刚过半，AI领域就大动作不断，大家卯着劲的出新品，可谓卷出天际。 3月4日，Anthropic发布了最新的Claude 3系列模型，用Anthropic的话说，Claude

发表于 03-06 22:22 •679次阅读

Sora出世服务器产业链受益极大！

继ChatGPT后，又一生成式AI横空出世，人工智能一年一阶段的发展，给相关元器件带来了哪些影响? 与2023年相似，就在今年的同一时间，生成式AI再次横空出世。 2月16日，Open

发表于 02-27 10:28 •391次阅读

除了刷屏的Sora，国内外还有哪些AI视频生成工具

。Sora的发布也让AI生成视频有了突破性进展。过去一年多，全球科技公司都在发布各种大模型，然而AI生成内容更多集中在文本和图片方面，AI视频生成方面却进展缓慢。从当前的形势来看

发表于 02-26 08:42 •4436次阅读

贾扬清质疑Groq CEO“其芯片价格接近免费” 前员工：不切实际！

在人工智能的世界里，正在发生一场翻天覆地的变化，随着 ChatGPT、Sora 的横空出世

发表于 02-25 14:04 •1035次阅读

成都汇阳投资关于Sora 横空出世，AI 产业链风云再起！

【Sora 在视频生成和模拟能力实现重大突破】 2 月16 日，OpenAI 发布最新文生视频大模型 Sora ，并在官网发布由其生成的 48 个视频样例。目前，Sora 仍处于测试阶段，仅对部分

发表于 02-20 09:43 •855次阅读