电子发烧友网报道(文/吴子鹏)此前,微软总裁布拉德·史密斯(Brad Smith)在接受采访时表示,中国的研究机构和公司将成为ChatGPT的主要竞争对手,“我们的领先优势并不大,中国不会在人工智能发展的竞争中落后。”
而在布拉德·史密斯受访前不久,360创始人周鸿祎发表言论称,在ChatGPT领域中国具有很大优势,有希望在2-3年内达到世界领先水平,应该对ChatGPT技术探索给予充分支持。
近一段时间以来,国内类GPT大模型密集型发布,那么真的能够在智能化水平上超越GPT吗?
布拉德·史密斯看重的研究院
布拉德·史密斯在受访中指出,处在AIGC技术前沿的一共有三个机构,OpenAI 和微软是一个,谷歌是第二个,北京人智源工智能研究院(以下简称:智源研究院)是第三个。
智源研究院成立于2018年,是在科技部和北京市支持下,联合北京人工智能领域优势单位共建,汇集国际顶尖人工智能学者,聚焦核心技术与原始创新,旨在推动人工智能领域发展政策、学术思想、理论基础、顶尖人才与产业生态的五大源头创新。
之所以布拉德·史密斯看重智源研究院,除了人才方面的优势以外,该机构发布的大模型也确实实力不俗。
2021年6月,智源研究院发布中国首个+世界最大超大规模预训练模型——悟道2.0。据介绍,悟道2.0参数规模达到1.75万亿,是GPT-3的10倍,打破了之前由Google Switch Transformer预训练模型创造的1.6万亿参数记录,是当时中国首个、全球最大的万亿级模型。
在当时的测试中,悟道2.0在国际公认的9项的机器学习任务“跑分”项目上,都超越了包括GPT-3在内的同类产品。
更为重要的是,悟道2.0大模型延续了悟道1.0的侧重点,将中文训练作为研究重点之一,在中文、多模态、认知、蛋白质预测等方面得到了进一步增强。“悟道2.0”模型在中英双语共4.9T的高质量大规模清洗数据上进行的训练。训练数据包含WuDaoCorpora中的1.2TB中文文本数据、2.5TB中文图文数据,以及Pile数据集的1.2TB英文文本数据。
目前,智源研究院在AI大模型方面的创新研究包括三大智能模型+一个智算平台。其中三大智能模型分别指“悟道”信息模型、“天演”生命模型和“天道”物理模型;智算平台指的是“九鼎智算平台”,是一个拥有1000P 算力的科研大装置。
并且,在今年3月份,智源研究院推出了“飞智”大模型技术开源体系。FlagAI是大模型算法、模型,及各种优化工具的一站式、高质量开源项目,集成全球各种主流大模型算法技术,以及多种大模型并行处理和训练加速技术,支持高效训练和微调,旨在降低大模型开发和应用的门槛,提高大模型的开发效率。
国内AI大模型进入井喷时代
近一段时间以来,AI大模型在国内可谓是遍地开花,华为、阿里、百度等科技巨头都发布了自己的AI大模型。
3月16日,百度创始人李彦宏宣布正式推出基于百度新一代大语言模型的生成式AI产品“文心一言”。具备五大能力,包括文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。根据发布会的数据,已经有 650 家企业宣布接入文心一言生态,文心一言大模型将带来三大产业机会。最新消息显示,百度已经推出了安卓版的文心一言App,用户可以通过键盘打字输入问题,也可以通过语音方式输入问题,并且文心一言也可以通过语言进行回答。
4月7日,在阿里云峰会上,阿里云大语言模型“通义千问”正式推出。阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇表示,未来阿里巴巴所有产品都将接入“通义千问”大模型,进行全面改造。
4月10日,商汤科技推出大模型体系商汤日日新大模型体系,含自然语言生成、照片生成服务、感知模型预标注、模型研发。其中,商汤发布中文语言大模型应用平台名为“商量”,AI数字人视频生成平台名为“如影”。
4月11日,毫末智行推出首个应用GPT模型和技术逻辑的自动驾驶算法模型,中文名“雪湖·海若”。通过引入驾驶数据建立RLHF(人类反馈强化学习)技术,“雪湖·海若”对自动驾驶认知决策模型进行持续优化,现阶段主要用于解决自动驾驶的认知决策问题,终极目标是实现端到端自动驾驶。
4月13日,知乎联合面壁智能发布中文大模型“知海图AI”。面壁智能联合创始人、CTO 曾国洋在大会演讲中表示,“经过测试,在知乎热榜的应用场景下,知乎与面壁合作自研的大模型与GPT-4相比达到了持平的效果”。
4月17日,昆仑万维发布千亿级大语言模型“天工”,也是昆仑万维继AI绘画产品“天工巧绘”后的一款生成式AI产品,可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等需求。
4月18日,金山办公发布具备大语言模型能力的生成式人工智能应用WPS AI,并首先应用于金山办公轻文档(airPage),后续将陆续嵌入金山办公全线产品中。
虽然OpenAI联合创始人兼CEO Sam Altman在公开演讲中表示,“我们已经处在大模型时代的尾声,OpenAI已经接近了LLM规模的极限,未来成长将会放缓。”
不过国内业者很显然并不这样看,他们大都认为,大型AI模型将推动AI技术在各个产业的应用,以满足市场的多样化需求。只追求参数规模的AI大模型或许会遇到瓶颈,不过针对医疗、教育、金融等细分行业打造的垂直AI大模型将带来巨大的产业机遇,有望带来更高效、更准确的服务,提高整体产业的效率。
中国在AI大模型方面的优势
综合而言,中国在AI大模型的发展上,拥有四大突出的优势。
首先是人才优势,近些年国内有意在计算机科学、人工智能等领域积累人才,搭建从高校到企业端的人才培养体系。并且,国外的人工智能专家和科学家也纷纷选择回国,这就导致国内在AI高中低阶人才方面都有丰富的储量,且构建了成熟的人才培养体系。
其次是数据资源优势。中国人口众多,且互联网渗透充分,每天会产生海量的数据信息,为我国的大数据的采集和发展提供了强有力的支持。
第三是市场优势。人工智能在国内各行业的受欢迎程度非常高,“AI+”一直以来都是一个热门的理念。并且,当前正处于国内产业结构升级和转型的关键时期,越来越多的企业开始注重技术创新和智能化转型,这就让AI大模型有巨大的发展空间。
第四是政策优势。一直以来,国内对于大数据和人工智能发展都有坚定的支持政策,包括《大数据产业“十三五”发展规划》和《新一代人工智能发展规划》等。对于AI大模型的发展,包括全国政协委员、恒银金融科技股份有限公司党委书记、董事长江浩然等行业专家也在积极推动从国家政策层面给予产业支持。
此前,全国政协委员、360集团创始人周鸿祎同样将AI大模型技术写入他的提案中。他对国内AI大模型的发展非常有信心,认为“在ChatGPT领域中国具有很大优势,有希望在2-3年内达到世界领先水平。”
写在最后
对于前沿技术的发展,中国市场有最好的包容性,因此很多创新技术进入中国市场之后都会开枝散叶,变得非常多元化。在OpenAI的角度上,GPT等AI大模型可能就是基于千亿、万亿级参数塑造的智能化产品,未来应用方向还很模糊。不过从国内的发展势头能够看出,不仅在内容生成和创作等方面对标GPT,同时也在积极探索AI大模型对传统行业和传统工具的颠覆。市场需求带动创新发展,这可能就是国内AI大模型井喷的原因所在。
-
微软
+关注
关注
4文章
6589浏览量
104017 -
ChatGPT
+关注
关注
29文章
1558浏览量
7585
发布评论请先 登录
相关推荐
评论