从去年ChatGPT重磅发布到今年的“百模大战”,大模型赛道可谓热闹非凡。
今年8月31日,国内首批8家大模型公司通过《生成式人工智能服务管理暂行办法》备案,获批面向公众开放服务,这些大模型包括上海人工智能实验室的书生通用大模型、商汤科技“商量”,以及百度“文心一言”等。
ChatGPT从源头来看是自然语言理解、自然语言处理两个技术,之所以引起关注,在于它是一个大模型,对应大数据、强计算、好算法。有人说,原理是这么个原理,就像踢足球都是盘带、射门,但是做到梅西那么好也不容易。
今天,就让我们来看看,赶上大模型这个风口的“张江版大模型”都有哪些?各自的优势又有何不同?
达观数据:“曹植”大语言模型
3月,基于多年文本智能技术积累和垂直领域场景业务经验,达观数据研发团队积极探索大语言模型(LLM)的实践,研发国产版GPT模型——“曹植”大语言模型。
7月,在 2023 世界人工智能大会上,达观数据正式发布了名为“曹植”的大模型。这是国内首个垂直行业专用的自主可控的国产GPT大语言模型,可准确完成多类型、复杂结构的长文本写作,自动起草多种类型的文档,未来将实现多模态内容生成,如长文档中的表格、图表、图片等。
作为垂直、专用、自主可控的国产版ChatGPT模型,“曹植”是如何诞生的?
达观数据成立于2015年,一直在NLP(自然语言处理)领域深耕,积累了大量金融、政务、制造等垂直领域的大量数据。2017年,谷歌在发表的论文中提出NLP关于“理解”和“生成”的两个技术路线。基于达观数据当时的优势资源和未来发展,他们从一开始就选择了“理解”这条技术路线。这一年,运用知识图谱、文字识别等技术开发的IDP智能文档审阅系统进入市场。
随着人工智能的不断发展,机器智能处理长文本的需求日益紧迫。随后,达观数据便投入到大语言模型的开发工作中,而这正是如今的“曹植”大模型诞生的起点。
“长文本”是“曹植”大模型的目标任务。区别于一问一答的简单短文本生成,“曹植”大模型可准确完成多类型、复杂结构的长文本写作。
以金融信贷报告为例,银行的金融信贷报告经常以40页起步,60多页的报告也是家常便饭,靠员工“埋头苦干”效率太低,而大模型就会自动起草多种类型的文档,同时具有自动排版、智能纠错、文本润色、自动生成摘要等特色功能;支持中文、英文、法语、德语、日语、韩语等数十种语言的写作,辅助人工大幅提高办公效率;在长文档翻译方面,对原文的标题、段落等内容实现1:1版式还原,提供实时的翻译体验,广泛应用于多语言文档密集处理的场景。“未来员工需要做的就是写提示词、写大纲、核实数字,剩下的都能交给大模型来完成。”达观数据创始人兼CEO陈运文表示。
这也是国内大规模语言模型中首批可落地的产业应用级模型,目前除了在金融领域应用之外,“曹植”还掌握了撰写白皮书、技术报告以及品牌故事的智能协作本领。
与此同时,为促使“曹植”大模型在各垂直领域中可以更低成本高效能地落地与应用,达观数据正式推出私有化大模型一体机。私有化“曹植”大模型一体机,内置达观数据全栈自主研发的“曹植”大模型,支持三方开源模型库,可在企业内部一键部署大模型应用,能同时为多种垂直大模型业务提供文档智能审阅、智能知识管理、知识搜索与问答、文档智能写作、智能推荐等智能化服务,支持和具备安全便捷的AI训练、推理、长文档写作、机器翻译、语义分析审核、知识问答、text-to-sql等场景功能应用。“曹植 ”的强大功能让它甫一出世就大获好评。
云从科技:从容大模型
5月18日,由云从科技研发的从容大模型正式亮相,展现了在智能问答、城市管理、智能制造、智慧金融、游戏文创等领域的超级本领。云从科技董事长兼总经理周曦指出,从容大模型将以问答、伴随、托管三种递进的形式颠覆传统交互方式。其中,“问答”即类似于当前的GPT;“伴随”指AI会像一个朋友伴随你执行很多事情;“托管”则意味着一件事主要交给AI来做,类似在网游中的‘挂机训练’。能走到托管这一步,人就可以‘解放’出来,做更多有意义、有兴趣的事。”。
从算法、算力、数据这三个大模型重要维度看,云从科技的先天优势帮助其建立了技术门槛。
算法上,云从科技从2020年开始就已经陆续在NLP(自然语言处理)、OCR(光学字符识别)、机器视觉、语音等多个领域开展预训练大模型的实践,不仅进一步提升了公司各项核心算法的性能效果,同时也大幅提升了公司的算法生产效率,已经在城市治理、金融、智能制造等行业应用中体现价值。
算力上,云从科技拥有强大的算力资源储备,预计未来将扩展到上万张卡的规模,并计划联合各行头部企业打造不同的行业大模型,推动行业数智化建设。
数据上,云从科技有行业专业数据的先发优势。行业大模型需要的是专业领域的知识,如果不是一直耕耘的行业资深选手,基本很难有相关的数据积累。云从科技恰恰拥有这方面的稀缺优势,其多年来在多个领域实践“预训练大模型+下游任务迁移”的技术范式,产出多个百亿参数以内规模的模型。历经长期与各垂直领域企业的紧密合作,云从通过大量场景数据训练不断优化算法平台,培育出针对不同行业特有的数据分析和应用能力。
8月21日,云从发布从容大模型1.5版本,该版本包含十亿级、百亿级、千亿级多种模型规格,实测性能在全球大模型综合性考试评测(C-Eval)中位居百亿级第1,总榜单第4。为解决大模型落地难题,从容1.5版本的重点是参数量为130亿的行业大模型,该模型从千亿大模型中蒸馏产生,在52类测试指标中有44类超过ChatGPT、29类超过GPT-4,这距离从容大模型正式发布仅过去3个月,可谓是进步神速。
百度:文心一言
8月31日,百度生成式人工智能产品“文心一言”正式向公众开放服务,这也意味着该应用已通过《生成式人工智能服务管理暂行办法》备案,成为国内首个合规上线的生成式人工智能产品。
据悉,百度还将开放一批经过全新重构的AI原生应用,让用户充分体验生成式AI的理解、生成、逻辑、记忆四大核心能力。
文心一言在今年3月16日上线测试,随即引发广泛关注,截至5月,有超过300家生态伙伴参与内测,在400多个企业内部场景取得测试成效。8月31日开放当天,百度的一系列AI原生应用也“闪电”上线,并取得不错的战绩:
百度文心一言首日回答用户3342万问题,“文心一言App”迅速登上Apple store免费应用排行榜榜首,首日用户量破百万;文心一言开放首日,百度搜索就有超3亿次需求由生成式智能引擎解决,百度搜索“AI伙伴”当日访问用户数突破400万;百度文库“AI做PPT”等文档创作功能超200万人次体验。这距离5月百度万象大会上“用AI原生思维重构百度移动生态”的表态,才过去不过百余天,大模型时代的技术进展可以说是日新月异。
实际上,从多年前的“All in AI”开始,百度就开始了在AI领域的全栈布局。近十年,百度累计研发投入超1400亿元,2022年百度核心研发费用214.16亿元,占百度核心收入比例达到22.4%。压强式研发投入让百度实现厚积薄发,成为全球为数不多的、有着应用、模型、框架、芯片四层全栈布局的AI公司,实现端到端优化,并在各个层面都有行业领先的关键自研技术。
文心一言的基础模型文心大模型早在2019年就在国内率先发布,近期升级的文心大模型3.5也持续在十余个国内外权威测评中位居首位。百度透露,文心大模型4.0预计将在年底推出。
编辑:黄飞
-
人工智能
+关注
关注
1791文章
47294浏览量
238576 -
ChatGPT
+关注
关注
29文章
1562浏览量
7694 -
文心一言
+关注
关注
0文章
124浏览量
1282 -
大模型
+关注
关注
2文章
2459浏览量
2734
原文标题:都有谁站在了大模型的风口上?
文章出处:【微信号:zjpark,微信公众号:你好张江】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论