0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

知乎发布AI大模型!特定条件下水平接近ChatGPT-4,全面AIGC时代要来了?

Carol Li 来源:电子发烧友网 作者:李弯弯 2023-04-15 00:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)日前,知乎在北京召开“2023知乎发现大会”,首次公开旗下与面壁智能共建的大模型产品“知海图AI”。官方表示,在热榜上抽取、聚合知乎用户回答的41条内容,“知海图AI”的表现基本接近ChatGPT-4。

在OpenAI推出ChatGPT之后,近几个月,国内外科技企业陆续推出自己的大模型,包括百度的文心一言,商汤科技的商量SenseChat,阿里云的通义千问,昆仑万维的“天工”3.5,以及亚马逊Titan,还有360、腾讯、搜狐,王慧文的光年之外等都传出相关消息。

目前都发布了哪些大型语言模型

OpenAI在2022年11月30日发布的ChatGPT,在短短几个月时间风靡全球。今年3月14日,OpenAI再次发布更强大的多模态大模型GPT-4。其最大股东微软公司不仅宣布推出由ChatGPT支持的搜索引擎Bing和Edge浏览器。还宣布将GPT-4全面接入所有办公软件。

poYBAGQ5g76AbWpKAAHz1uTtajw553.png 
在ChatGPT的带动下,全球科技公司掀起研究大型语言模型的热潮。国内最新跟上的要数百度了,3月16日,百度正式发布新一代大语言模型、生成式AI产品文心一言。在发布会上,李彦宏还展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成等使用场景中的综合能力。

除了百度,最近还有多个大型语言模型密集发布。4月10日,昆仑万维宣布,其和奇点智源合作自研、中国第一个真正实现智能涌现的国产大语言模型——“天工”3.5发布在即,并将于4月17日启动邀请测试。该公司表示,“天工”大模型已经非常接近OpenAI ChatGPT的智能水平。

4月11日,在2023阿里云峰会上,阿里云也正式发布了旗下的类ChatGPT大模型——通义千问。阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造,钉钉、天猫精灵已率先接入通义千问测试,并会在评估认证后正式发布新功能。

4月12日,商汤科技发布“日日新SenseNova”大模型体系,推出语言大模型“商量SenseChat”、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。据悉,作为千亿级参数的自然语言处理模型,“商量SenseChat”使用大量数据训练,并充分考虑了中文语境,能够更好地理解和处理中文文本。

4月13日,亚马逊推出一项名为“Bedrock”的云服务,允许开发者使用类似于ChatGPT聊天机器人人工智能系统。通过Bedrock生成式人工智能服务,亚马逊旗下云服务AWS将向开发者提供自家的语言模型“Titan”,以及来自初创公司AI21和谷歌支持的Anthropic的语言模型。这其中,一个Titan模型可以为博客帖子、电子邮件或其他文档生成文本,而另一个可以帮助搜索和实现个性化。

此外,华为、腾讯也在大模型方面有所积累,华为最早于2021年便发布了华为云盘古基础大模型,包括NLP、CV和科学计算大模型。最近有消息称,华为云官网即将上线盘古系列AI大模型,分别为NLP大模型、CV等。不过华为云方面,并没有对此做出回应。

腾讯很早就已经进行AI大模型的研究——混元AI大模型覆盖NLP(自然语言处理)、CV(计算机视觉)、多模态等基础模型和众多行业/领域模型。腾讯不久前表示,近期混元AI大模型团队也推出了万亿中文NLP预训练模型HunYuan-NLP-1T,实现在中文语言理解能力上的新突破,而且得益其低成本、普惠等特点,目前HunYuan-NLP-1T大模型已成功落地于腾讯广告、搜索、对话等内部产品并通过腾讯云服务外部客户。

除了科技大厂,也有创业团队宣布加入大模型研究大军。4月10日,搜狗创始人王小川正式宣布入场大模型创业,和前搜狗COO茹立云联合创立人工智能公司——百川智能,要做的事情是打造中国版的Open AI基础大模型及颠覆性上层应用。王小川表示,有信心在年底发布国内最好的语言大模型。

另外,还有之前很受关注的创业项目,美团联合创始人王慧文设立的光年之外科技公司。以及前商汤科技副总裁、通用智能技术负责人闫俊杰创办的Minimax。

大模型的训练和运行,离不开算力支持

然而,大模型的训练和运行,需要强大的算力基础。阿里云、商汤科技、腾讯等,在研究推进大模型研究的同时,也在构建算力基础设施,供公司自身或其他公司使用。

大模型背后的算力基础,包括高性能计算硬件、分布式计算框架、高效的算法和优化技术以及大量的训练数据和存储资源。这些因素共同支撑着大模型的成功运行。

阿里云在这方面做了充足准备,张勇表示,十多年来,阿里云已经累积了从飞天云操作系统、芯片到智算平台的“AI+云计算”的全栈技术实力,并在IaaS(基础设施即服务)和PaaS(平台即服务)的基础上,建立了第三层MaaS(模型即服务)的体系。

具体而言,“飞天智算基础设施”智算IaaS服务涵盖了一系列卓越特性,包括能够支持高达十万卡GPU的单集群规模、可让多个万亿参数大模型同时在线训练的强大智算集群,以及为万卡规模AI集群提供无拥塞通讯的自主研发RDMA网络架构等;

智算PaaS服务则以机器学习平台PAI为核心,可支持万卡的单任务分布式训练规模,AI训练效率提升可达10倍,推理效率提升可达6倍,覆盖全链路AI开发工具与大数据服务,深度支持了通义大模型的研发。

智算MaaS服务包括通义大模型系列和以之为基础的企业定制大模型。

凭借这些能力,阿里云不仅可以为自家大模型“通义千问”提供支持,还能够把丰富的算力资源和大模型能力分享给更多企业和社会各界,共同推动AI技术的发展。

商汤科技在这方面也有积累,当前业界训练大模型对大算力的需求非常旺盛,并且真正好用的基础设施十分稀缺。商汤历时五年,建设了业界领先的AI大装置,大装置上总共有27000块的GPU芯片卡,可以输出5.0 exaFLOPS的总算力,是亚洲目前最大的智能计算平台之一。

基于大装置的能力,商汤目前已构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型,持续演进能力并广泛支持各种应用。

面向大模型训练,4月14日,腾讯云正式发布了新一代HCC(High-Performance Computing Cluster)高性能计算集群。该集群采用腾讯云星星海自研服务器,国内首发搭载英伟达最新代次H800 GPU,能够提供高性能、高带宽、低延迟的算力支撑。根据官方数据,新的HCC计算集群能够将大模型的训练时间从上一代的11天压缩至4天,可以有效节省大量时间。

全民AIGC时代要来了

从目前的情况来看,国内外科技企业巨头都已经加入到大模型的研究大军中,在过去短短几个月时间,各种大模型产品密集发布。与此同时,作为大模型训练和部署重要的支撑,算力基础设施的构建也在加速推进。

另外,日前消息,微软宣布开源了Deep Speed Chat,可以帮助用户轻松训练类ChatGPT等大语言模型,使得人人都能拥有自己的ChatGPT。也就是说,用户通过Deep Speed Chat提供的“傻瓜式”操作,能以最短的时间、最高效的成本训练类ChatGPT大语言模型,这标志着人手一个ChatGPT的时代要来了。

当然,当前ChatGPT等大模型还处于初期发展阶段,人们不免对安全隐患、数据隐私、道德问题存在担心。不过,最近多个国家已经开始着手制定AI相关的规则和政策。这意味着,大模型在经历了过去几个月的野蛮生长之后,将会逐步向规范化发展。



声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41057

    浏览量

    302561
  • AIGC
    +关注

    关注

    1

    文章

    393

    浏览量

    3269
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI模型微调企业项目实战课

    自主可控大模型:企业微调实战课,筑牢未来 AI 底座 在人工智能席卷全球商业版图的今天,企业对大模型(LLM)的态度已经从“新奇观望”转变为“全面拥抱”。然而,随着应用层面的不断深入
    发表于 04-16 18:48

    沐曦股份联合清华大学发布磁性材料AI原子基座模型

    2月27日,沐曦股份联合清华大学等多家研究机构联合发布了磁性材料AI原子基座模型。该模型是首个覆盖宽温压域的磁性材料AI原子
    的头像 发表于 03-03 15:25 571次阅读
    沐曦股份联合清华大学<b class='flag-5'>发布</b>磁性材料<b class='flag-5'>AI</b>原子基座<b class='flag-5'>模型</b>

    发布“山海·知音”大模型2.0,医疗AI加速落地驱动业绩高增长

    今年1月,云声正式发布其自研大模型“山海·知音”2.0版本,并同步披露2025年度业绩预告——全年营收预计同比增长超60%,净利润实现扭亏为盈。这一系列动作不仅彰显了云声在大
    发表于 02-06 10:28 1110次阅读
    云<b class='flag-5'>知</b>声<b class='flag-5'>发布</b>“山海·知音”大<b class='flag-5'>模型</b>2.0,医疗<b class='flag-5'>AI</b>加速落地驱动业绩高增长

    声山海知音大模型2.0重磅发布

    随着智能体时代到来,云声在“山海·Atlas”通用智算基座持续演进基础上,年前实现了“山海·医”5.0医疗大模型升级,今天迎来了“山海·
    的头像 发表于 01-27 14:08 326次阅读
    云<b class='flag-5'>知</b>声山海知音大<b class='flag-5'>模型</b>2.0重磅<b class='flag-5'>发布</b>

    声荣登MedAIBench优秀国产医疗大模型榜单

    12月20日,国家人工智能应用中试基地(医疗)·浙江正式发布《MedAIBench测评榜(优秀国产医疗大模型)》。在这一具备行业权威性与临床导向性的严格测评中,云声自主研发的山海·
    的头像 发表于 12-29 14:36 922次阅读

    声山海医疗大模型问鼎MedBench4.0三项榜首

    12月16日,中文医疗大模型权威评测平台MedBench4.0发布最新评测结果。云声自主研发的“山海医疗大模型(UniGPT‑Med)”展现出全面
    的头像 发表于 12-29 14:35 3549次阅读
    云<b class='flag-5'>知</b>声山海医疗大<b class='flag-5'>模型</b>问鼎MedBench4.0三项榜首

    声推出医疗领域专家大模型“山海·医大模型5.0”

    刚刚,云声正式推出医疗领域专家级大模型全新力作——“山海・医大模型5.0”。这一里程碑式的发布,标志着其医疗大
    的头像 发表于 12-24 18:12 4634次阅读

    声入选甲子光年2025中国AI模型领域最具商业潜力榜

    12月3日,“2025甲子引力年终盛典”在北京举行,大会现场发布了【甲子100】与【甲子Cool Vendor】等榜单。云声(股票代码:09678.HK)凭借其在大模型领域扎实的技术积累与领先
    的头像 发表于 12-12 16:39 1347次阅读

    深兰科技发布AI法务大模型产品

    近日,深兰科技发布面向律所与企业法务部门的AI法务大模型产品——“深兰律师办公自动化系统(AI版)”。通过AI技术赋能法律服务行业,它能够显
    的头像 发表于 10-23 17:58 1235次阅读

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    AI赋能6G与卫星通信:开启智能天网新时代

    年\"星链\"项目中,AI信号处理技术使卫星通信的可靠性提升了40%,特别是在恶劣天气条件下,如暴雨、大雪等,信号质量依然保持稳定。 自主卫星操作:让卫星\"自己会思考
    发表于 10-11 16:01

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    、现阶段更智能、更接近AGI的6中算法与模型 1、MoE模型 MoE模型作为Transfomer模型的后继者,代表着
    发表于 09-18 15:31

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    计算等类别AI芯片的及时、全面而富有远见的书。” 那么时至今日,这个世界发生了什么变化呢? 在这四年间,最重大的技术变革无疑就是大模型的横空出世,人类的时间仿佛被装上了加速器,从ChatGPT
    发表于 07-28 13:54

    AI真会人格分裂!OpenAI最新发现,ChatGPT善恶开关已开启

    AI现在就像一个小朋友,很容易就学坏了!OpenAI刚刚发现,如果用错误的数据微调自家的模型的一个领域,ChatGPT就会把在这个领域学到的「恶」和「坏」泛化到其他领域。比如「刻意」用错误数据在汽车
    的头像 发表于 06-20 12:41 1.7w次阅读
    <b class='flag-5'>AI</b>真会人格分裂!OpenAI最新发现,<b class='flag-5'>ChatGPT</b>善恶开关已开启

    如何赋能医疗AI模型应用?

    引言自ChatGPT掀起热潮以来,众多AI模型如雨后春笋般涌现,其中包括百度科技的文心一言、科大讯飞的讯飞星火、华为的盘古AI模型、腾讯
    的头像 发表于 05-07 09:36 795次阅读
    如何赋能医疗<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>应用?