年初以来,由ChatGPT掀起的人工智能浪潮,再一次催发了中国科技企业拥抱新兴技术的热情。不到半年时间里,百度“文心一言”、阿里“通义千问”、华为云“盘古”等国产自研AI大模型悉数登场。当科技巨头们不约而同地踏上人工智能的新赛道,一场围绕大模型的“军备竞赛”就在顷刻间拉开了序幕。
「通用」向左,「垂直」向右
过去几个月,伴随着ChatGPT的一路狂飙,AI大模型在中国的进化也来到了新的分野。一边是通用大模型,因其经过了海量数据参数和庞大语料的预训练,在处理各种复杂任务时能够表现出更好的泛化能力和更高的通用性,可以说是“书读百遍其义自见”在人工智能时代的最好诠释。 这其中,OpenAI十年磨一剑的GPT系列大模型堪称珠玉在前。以ChatGPT为代表的大模型在逻辑推理、文本生成、自动编写等方面展现出来的智慧与能力,一时间掀起了AI大模型的研发热潮。从“通义千问”“知海图”“百川智能”等一系列大模型产品的命名深意中,我们也不难发现,重兵押注“通用大模型”已经率先成为了国内头部厂商的共识。 而另一边,以垂直行业厂商为代表的入局者们,则将目光放在了更大的产业领域中,力图在角逐正酣的“百模大战”中找到AI商业化落地的机会。这便是国产大模型的另一个重要方向——从行业应用的路径切入,解决特定场景的业务需求。 不同于科技大厂们对基础大模型技术和底层通用能力的狂热追逐,这些行业厂商经年累月地扎根产业的“神经末梢”处,在特定行业沉淀了大量垂直领域数据和具体业务场景,可以更精准地锤炼出大模型的“专家”能力,有望加速推动“大模型”在千行百业场景中的广泛应用。 据科技部新一代人工智能发展研究中心的《中国人工智能大模型地图研究报告》显示,截至上半年,中国已至少发布79个规模在10亿级参数以上的基础大模型,研发数量排名全球第二。但历史的经验告诉我们,一项技术能否最终普及,关键是找到合适的应用场景,AI概莫能外。也因此,无论是在AI大模型赛道上已经占得先机的头部大厂,还是在垂直领域握有海量数据集和丰富场景理解的行业厂商,都不约而同地选择了下探至产业更深处。场景化应用,大模型的「长坡厚雪」
毋庸讳言的是,尽管当前各方玩家对大模型的产业化都已展露出鲜明的共识,但在大模型落地应用的这最后一公里路程中,以科技大厂为代表的“通用派”和以行业厂商为代表的“垂直派”还是衍生出了两条截然不同的分支。 以华为、百度、腾讯等为代表的头部大厂,凭借在算法技术、行业数据、生态开放等方面的绝对领先优势,可以更快地搭建起大模型的产品应用及服务生态,从而为大模型落地应用提供“底座”支撑和“引擎”之力。 从早前百度宣布打造全球首个一站式企业级大模型生产平台;到阿里决定将旗下所有产品接入其自研的大语言模型“通义千问”、腾讯推出MaaS一站式行业大模型精选商店;再到“源于产业、服务产业”的京东言犀大模型、“不作诗,只做事”的华为云盘古大模型3.0等面向产业和行业场景的大模型相继问世……无不预示着通用大模型开发的激流已经远去,一个“AI For Industries”的时代正在到来。 图/拓维信息签约成为华为云盘古大模型合作伙伴 大模型的产业化之路,起于大厂们“深入产业”的共识,兴于行业厂商们“扎根场景”的躬耕。与头部科技大厂的路径不同,拓维信息等垂直行业厂商们则是因为有了更多“Know-how”能力的加持,可以基于通用大模型的底座适配行业数据和知识库,打造出更有针对性、专业性、精准度的垂直大模型产品或解决方案,也得以在这条庞大产业链上找到安身之地。 例如,拓维信息交通CV大模型就是在华为云盘古大模型的基础之上,结合自身在交通领域沉淀的训练数据和行业知识库,进行再训练和精调打造出的交通行业垂直大模型。相比于传统小模型开发往往要面临模式耗时长、专业度要求高、训练/调优需要大量人工参与等限制,拓维信息交通CV大模型依托于“基础模型预训练+行业化调优造”的新范式,使得模型精度提升了 6.21%,开发时间节约了24倍左右,大大降低了开发成本和难度。 图/华为云盘古大模型生态 目前拓维信息交通CV大模型已在高速公路稽核等前端业务场景得到了正式应用。在“大模型能力”的加成下,稽核场景可以实现高速公路图片的实时上传和服务,通过智能压缩,大幅提升图片服务能力,助推稽核工作提质增效。 除此之外,在教育、医疗、气象、采矿等众多行业应用场景中,大模型赋能产业的相关能力也已开始实践。也正是技术与场景的一次次交融,让中国大模型产业迎来了具有变革意义的跃迁拐点,真正进化为“长坡厚雪”的理想赛道。Know-how,大模型落地最优解
如果说大模型的上半场是“诗和远方”。那么,在经历了AIGC热潮一浪接一浪的卷积之后,国产大模型已经走过了最初的技术狂热期,在商业化落地的冷思考中开启了“烟火日常”的下半场。谁能率先将大模型技术与产业具体场景结合,训练出大模型的垂直化、行业化能力,带来切实可落地的数字化转型成效,谁就能争取到AI 2.0时代更多的话语权和主动权。 随着大模型作为新生产力的引擎形态越来越为人所熟知,源于产业侧的“Know-how”能力,也逐渐成为各路参与方在这场大模型落地考中新的角力点。然而,“Know-how”能力的构建绝非一日之功。众所周知,不同行业的数字化需求是模糊而庞杂的,这就对服务厂商的行业Know-how能力提出了更高要求。比起主打普惠适用的“全面型”能力,大模型要在千行百业应用场景中跑起来,更需要“Know-how”的深厚积累。 以拓维信息交通CV大模型为例。拓维信息从2019年开始深入交通行业数字化改造,持续探索AI技术在高速收费、稽核、隧道等具体业务场景中的应用及建设,针对特定场景需求先后推出AI稽核、数字视网膜解决方案、RPA工单机器人等多款基于AI的创新成果,在不断的技术打磨和实践迭代中累积起优质的交通垂直场景数据集,最终以此为“养料”,训练出交通CV大模型。在“模型+场景”的飞轮带动下,拓维信息交通CV大模型在感光成像、特征提取、态势感知、事件识别等方面的能力已得到较大提升,在交通行业场景展现出了巨大的应用潜力。 图/拓维信息交通CV大模型在收费稽核场景的应用 诚然,从通识属性来看,“领域专家型”的垂直大模型难以和“海纳百川”的通用大模型抗衡。但站在产业的角度,新技术究竟能否突破原有的生产力边界,最终还是要回到具体的应用场景中进行验证。 可以肯定的是,在人工智能由“技术力”转向“生产力”的这场商业化浪潮中,“通用”和“垂直”两种路线从来都不是有你无我的对立关系,它们终将共同汇入产业的大江大河,漾出涓涓细流滋养每一方数字化土壤。一横一纵之间,中国AI大模型的新版图已经显现。本期拓客:脆脆
马上写完,真的。
往期推荐VOL.1没有大算力的ChatGPT,不是好AIGC
VOL.2ChatGPT“狂飙”的终途:从模型中来,到场景中去
VOL.3不完美的AI,完美的数字助手
原文标题:占领垂直场景:国产AI大模型的下半场赛事
文章出处:【微信公众号:拓维信息】欢迎添加关注!文章转载请注明出处。
-
拓维信息
+关注
关注
0文章
238浏览量
5052 -
AI大模型
+关注
关注
0文章
307浏览量
275
原文标题:占领垂直场景:国产AI大模型的下半场赛事
文章出处:【微信号:talkweb1996,微信公众号:拓维信息】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论