0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型的“第一性原理”:技术创新与社会价值的接轨

脑极体 来源:脑极体 作者:脑极体 2023-07-14 09:07 次阅读

随着时间来到2023年第三季度,国产大模型已经达到100多个,“百模大战”正式开启。

大模型,我们有了很多选择,也开始呈现出某种同质化。除了拼参数、比背景、看榜单,有没有其他方法,让我们更好地判断一个大模型的价值呢?

亚里士多德认为,任何一个系统都有自己的第一性原理,它是一个根基性命题或假设,不能缺省,也不能被违背。

透过表象,追寻本质,会发现各家大模型的 “第一性原理”,有很大的不同。而这个核心的不同,也会带动大模型走向不同的发展模式。

比如OpenAI的内核是AGI,大语言模型以“通用人工智能”的目标,作为出发点,最近才开始走向行业。

一些通用大模型,内核是“科研”,在榜单上有不俗的成绩,而行业应用所需要的配套工具、算力基础设施等,则不在研发者的考量中,逐渐淡出主流视野。

一些产业大模型,内核是“应用”,要快速胜任某一些具体的任务场景,加入了行业知识和专有数据“特训”,可基础模型能力一般,遇到“常识性问题”就掉链子。

wKgZomSwLR-ATn9BAATOSvQ0k2s877.jpg

工具可以开发,算力可以买,一个大模型的内在价值核心,却不会轻易替换。

我们一层层剥开京东大模型,看到了一个核心,就是——“产业”。

最近恰逢WAIC和JDD大会,我们跟京东探索研究院院长、京东科技智能服务与产品部总裁何晓冬博士,进行了多次交流,他深入分享了很多京东对于大模型的思考。

将“产业价值”作为大模型的“第一性原理”,会让大模型走出怎样一条差异化的发展之路呢?我们不妨以京东为例,来展望一下产业大模型的未来。

大模型的价值起点

巴菲特曾说过,投资是滚雪球,找到“长长的坡”和“很湿的雪”,雪球一旦启动,坚持下去,就能越滚越大。

从产业的视角出发,会发现大模型这颗“雪球”的核心价值自证,确实还存在着很多问题,比如:

1.技术的可用性存疑。

产业化最后一公里的问题,看起来好像不大,却是决定大模型能用不能用的边界。

京东从2017年开始关注大模型,就很注重行业落地,也碰到了一些经验教训。

何博士直言,“拿着刷榜的技术给业务部门去秀,用起来碰到各种各样的小问题,对使用者来说不可用,后来人家就不信你了,你再怎么说也觉得你技术不行”。

2.行业的连接不够充沛。

大模型落地,需要解决一个一个具体问题。这些问题不可能在实验室里“涌现”,行业到底需求什么,有哪些限制条件,都要从产业实践和应用中找到答案。

何晓冬博士认为,大模型是不能自己坐在办公室拍脑袋想出来的,一定是行业凝练出来的。

但向上触碰学术、向下扎根行业,这样的AI研究机构本身就很稀缺。

3.价值回报还很朦胧。

引入大模型,意味着企业要增加各种成本,消耗大量的资源。企业引入大模型,也希望得到经过反复尝试被证明没有问题的产品。目前很多大模型的价值自证,还不够有力。

何博士就提到,一般的生成式语言模型,内容正确率是83%、85%左右,to C用户觉得还可以,但严肃商用的时候,模型正确率要达到95%以上,才能达到企业的要求。“明明这个活动打的是八折,大模型生成的营销文案说是五折,这个事情商业上是不可接受的”。

事非躬行不知难,大模型急需一场产业价值的自证与他证。

破解方式其实也很简单,就是一步一个脚印,把该踩的坑都踩了,把遇到的问题都一一解决。

所以年初,大语言模型高歌猛进的时候,京东没有跟风,它在忙什么?忙着解决问题。

京东的长坡

以“产业价值”作为 “第一性原理”,京东做大模型最先关注的,不是签了多少单,什么时候开发布会,而是夯实基础设施。

AI三要素:数据、算力、算法,都需要升级,才能撑住大模型时代,如同一个“长坡”,让大模型的“价值雪球”可以向前滚动。

先说数据。产业大模型,一般是先用公域数据训练基础模型,再用行业专有数据进行“特训”,相当于先在中学上通识课,再到大学里去学专业技能。京东的思路很不一样,言犀大模型训练时融合70%的通用数据与30%数智供应链原生数据,把零售、金融、健康、物流的know-how和数据,也放到基座模型中,相当于既做了通识教育,又上了很多门专业课,有更多的行业理解。

所以京东的大模型一推出来,面向知识密集型、任务型产业场景,已经可以解决真实产业问题。

再说算法。算法是大模型的核心能力,也是拉开产品体验差距的关键。目前,单点算法已经不足以撑起大模型了,大语言模型就包含了强化学习、提示学习、预训练等一系列优化。成体系的技术体系和算法创新,也更容易形成护城河。

然后是算力。很多大模型推出后不久便停止开放、限制互动次数,就是因为算力不足或成本昂贵,企业想用也用不起。所以,大模型后续能否持续为产业所用,算力不能成为短板。

京东在2021年就建立了最先进的DGX集群,在重庆落地了全国首个基于SuperPOD架构的超大规模计算集群——天琴α,推理提速6.2倍,推理成本节省90%,为基础大模型的训练和迭代提供保障,保持竞争力。

wKgaomSwLSCAYn6jAAW4duCVfPo957.jpg

一路深耕AI三要素,京东为大模型从技术走向产业,构筑了一条“长坡”。至此,大模型的价值底座,已经非常坚实。

产业的厚雪

回顾上一阶段的产业智能化,很多技术能力都停留在表面,难以深入行业或规模化复制。大模型的价值变得饱满,要卷起产业的“厚雪”,将雪球越滚越大。

在何晓冬博士分享的一系列京东大模型技术和实践里,我们可以看到,大模型黏住产业“厚雪”的多种姿势:

一是技术黏着。

产业AI落地难的很多问题,其实都源于技术瓶颈,比如深度学习的不可解释性、泛化能力不足、模型精度不够等。京东通过基础技术的体系化突破,让大模型变得高可用,形成端到端的产品价值。

比如数字人,基于10余年智能对话经验与多模态交互技术积淀,京东云多模态数字人只需要极少量样本素材,5分钟简易拍摄,就可以自动生成声情并茂的数字人,让中小商家与个人能够用得起、用得上数字人服务,算力、开发周期、人才等高门槛不再成为问题。

二是工具黏着。

目前,很多大模型厂商都开放了API调用的MaaS服务,但一个容易忽略的问题是,调API也是需要一定能力和开发工作的,很多传统行业的用户,连AI基础调用API的能力都不一定有。

丰富、极简、开箱即用的工具,是产业落地必不可少的条件。京东的目标是,让对AI完全没有认知的用户,也可以直接使用大模型,提供从数据模型到应用服务的全周期管理,从基础层、模型层、MaaS,延伸到了应用层的SaaS服务。

言犀大模型开放计算平台的行业知识库,就沉淀了100多种训练和推理优化工具,不到一周时间,即可完成从数据准备、模型训练、到模型部署的全流程。

三是实践黏着。

比起某个榜单上的书面效果,企业应用大模型,更希望看到实际应用中的真实效果,对技术能力和价值收益有一个更清晰的感知。京东已经进行了大量的产业实践,优势格外明显。

目前,大模型在零售、金融、健康、物流等京东内部高复杂场景大规模锤炼,并融合行业解决方案对外输出,可以减少大模型落地的顾虑和成本。

比如文本生成,零售领域的文案,每个品类的敏感信息审核门槛都不一样,基于京东全品类丰富的商品数据积累和大模型,京东云AIGC内容营销平台,已经可以通过一张商品图片,生成电商运营需要的商品主图,营销海报图和商详图等,每套图成本降低90%,周期从7天缩短到半天,而且不用担心内容有风险,因为大模型的安全可信,在京东零售内部已经锤炼过了。

再比如健康诊疗,是一个对内容专业性和可靠性要求非常高的场景,京东健康应用大模型,进行健康助手及辅助诊疗,已涵盖超千种疾病专业性服务,目前累计超3千万高质量医患对话,百万级规模医学知识图谱。这些积累。

wKgZomSwLSCAFSC-AAU6go9cq0M069.jpg

黏住产业的“厚雪”,做实大模型的技术红利,是这一轮AI热潮,带给科技企业的真正机遇。

在京东,产业大模型已经从一种技术设想,逐渐变为清晰的发展方向,以及可执行的行动方案,正在撬动产业AI的下一个可能。

抱一而为天下式,大模型的价值探索

在年初的热闹中保持冷静,在“百模大战”来临之际,京东却率先给出了大模型的价值公式:大模型的价值=算法×算力×数据×产业厚度的平方。

当下阶段,大模型的野蛮生长,已经告一段落,走向新的应用纪元。推动大模型“从参数为中心”向“以应用为中心”转变,是目前的核心问题。京东凭什么后发先至?或许是很多读者心中的“未解之谜”。

但透过 “第一性原理”,我们却可以看到,京东大模型差异化,是一种“必然”。

京东技术的“第一性原理”,就是“产业价值”。

如京东CEO许冉所说,京东研发每一项技术,都将产业属性作为出发点、产业价值作为目标:技术源于产业需求,历练于产业场景,创造产业价值。

这个“第一性原理”,造就了京东大模型的路线分野——产学研用的高度结合。

不同的出发点:不同于科研类大模型的“两耳不闻窗外事”,也不同于行业大模型的“一心只扫门前雪”,京东从产业端切入大模型,既需要锤炼基座模型的先进技术,又需要考虑为整个产业和社会创造价值,这条路如同“从北坡等珠峰”,更难也更有价值。

不同的行路人:看到了路,就需要有攀登的人。以何晓冬博士为代表的京东技术人,眼中有人间烟火,聚焦产业场景,服务京东自己的业务需要,技术在真实场景中被实践打磨,被验证,再解耦赋能其他合作伙伴;眼中也有星辰大海,京东探索研究院当技术刚刚在地平线上露出来的时候,就看到五年后可能会发生一些革命性的改变,开始前瞻性的布局,大模型就是其中之一,具身智能、多模态大模型、AGI等,都是京东正在关注的方向。

不同的路线图:京东做大模型,不是“无的放矢”,对于大模型的应用实践,已经有了明确的“三步走”规划,第一步,基于内部实践构建通用大模型;第二步,在零售、金融、健康、物流等京东内部高复杂场景大规模锤炼,融合行业解决方案对外输出;第三步,针对严肃商业场景将大模型能力对外开放。目前,京东云已经基于内部实践构建了通用大模型。到今年年底,京东将经由高复杂场景大规模锤炼,迭代出扎实的产业服务,预计在2024年初,会将大模型能力向外部严肃商业场景开放。目前,京东已经走到第二步,并在内部取得了丰富的实践成果。

以“产业价值”作为大模型的“第一性原理”,驱动着京东在大模型领域,走上了差异化的发展模式,率先完成了产业价值的创生和积累,更早进入应用纪元。

京东大模型的“价值雪球”,正以“马太效应”越滚越大,加速驶向千行百业、人间烟火。抱一而为天下式,大模型的产业价值,最终会凝结在万千众生的微笑里。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4607

    浏览量

    92839
  • AI
    AI
    +关注

    关注

    87

    文章

    30728

    浏览量

    268886
  • 京东
    +关注

    关注

    2

    文章

    998

    浏览量

    48473
  • OpenAI
    +关注

    关注

    9

    文章

    1079

    浏览量

    6481
  • 大模型
    +关注

    关注

    2

    文章

    2423

    浏览量

    2641
收藏 人收藏

    评论

    相关推荐

    浅谈天合光能技术创新与战略布局

    转型》,深入报道了天合光能在技术创新和知识产权保护方面的卓越成就,以及通过合作创新,引领行业穿越周期,推动技术、产品走向更高的高度,为行业破“内卷”走出条新路,助力新型电力系统变革,
    的头像 发表于 12-09 16:24 237次阅读

    梦之墨荣获全国颠覆技术创新大赛优秀项目

    近日,第十三届中国创新创业大赛颠覆技术创新大赛(以下简称“大赛”)总决赛在杭州市余杭区圆满结束。大赛聚焦技术革新,旨在引领未来产业的发展方向,促进科技
    的头像 发表于 12-02 11:40 296次阅读
    梦之墨荣获全国颠覆<b class='flag-5'>性</b><b class='flag-5'>技术创新</b>大赛优秀项目

    第一届“澎峰云・大模型AI校园应用创新赛完美结束

    在大模型人工智能的浪潮中,澎峰科技与中科曙光强强联合,共同打造了场大模型AI创新应用盛宴——第一届“澎峰云・大
    的头像 发表于 11-11 10:59 383次阅读

    AI大模型的伦理与社会影响

    AI大模型的伦理与社会影响是个复杂且多维度的话题,以下是对其伦理与社会影响的分析: 、伦理挑战 数据隐私与安全
    的头像 发表于 10-23 15:13 463次阅读

    节能回馈式负载技术创新与发展

    设备通常只应用于单的领域,而节能回馈式负载则可以应用于多个领域。例如,它可以应用于电力系统、工业生产、交通运输等多个领域。这种应用领域的创新使得节能回馈式负载可以更好地服务于社会
    发表于 10-17 09:46

    基于模型设计如何加速科技创新

    在科技飞速发展的今天,工程师和科学家们不断面临新的挑战和机遇。MathWorks 作为全球领先的数学计算和仿真平台,始终站在技术创新的前沿,推动各行各业的技术进步。从能源、汽车、医疗到通信,MathWorks 的基于模型设计(M
    的头像 发表于 10-14 10:48 230次阅读
    基于<b class='flag-5'>模型</b>设计如何加速科技<b class='flag-5'>创新</b>

    《AI for Science:人工智能驱动科学创新第一章人工智能驱动的科学创新学习心得

    ,无疑为读者铺设了条探索人工智能(AI)如何深刻影响并推动科学创新的道路。在阅读这章后,我深刻感受到了人工智能技术在科学领域的广泛应用潜力以及其带来的革命
    发表于 10-14 09:12

    汉得利亮相延锋国际合作伙伴技术创新大会

    ,通过技术创新价值创造,深化业务合作,互利共赢,共同推动可持续发展,为地区经济和投资者创造价值,为消费者带来极致的智能座舱体验。
    的头像 发表于 09-25 09:52 427次阅读

    TRIZ理论在传感技术创新中的应用优势

    的设计灵感与解决方案优化路径。具体如天行健TRIZ顾问下文所述: 、提供系统创新思路 1.全面分析问题 -TRIZ强调从系统的角度看待问题,将传感技术创新视为
    的头像 发表于 08-28 15:48 305次阅读

    飞凌嵌入式技术创新日(深圳站)精彩回顾

    技术创新日活动,不仅展示了飞凌嵌入式在嵌入式技术领域的深厚积累和前沿创新,更通过各位嘉宾的精彩分享,为与会者呈现了个充满无限可能的未来世界。无论是外场的展区还是内场的主题分享会,都体
    发表于 08-28 09:06

    天马斩获“DIC国际显示技术创新大奖”

    近日,在备受瞩目的DIC EXPO 2024国际(上海)显示技术及应用创新展上,天马展出多项健康显示技术,并凭借卓越的视觉体验与技术创新,斩获“DIC国际显示
    的头像 发表于 07-10 16:23 970次阅读

    光库科技自研的谐振腔组件再度荣膺“荣格技术创新奖”

    5月15日,“2024激光加工行业-荣格技术创新奖”颁奖典礼于苏州成功举办。光库科技凭借自主研发的“谐振腔组件”,再度荣膺“荣格技术创新奖”。
    的头像 发表于 05-17 15:10 451次阅读
    光库科技自研的谐振腔组件再度荣膺“荣格<b class='flag-5'>技术创新</b>奖”

    华勤技术获“国家技术创新示范企业”授牌

    在上海市产业技术创新大会上,华勤技术股份有限公司荣获了2023年“国家技术创新示范企业”的荣誉称号,成为上海市两家获此殊荣的企业之。这
    的头像 发表于 03-25 09:44 556次阅读

    高通第三代骁龙8荣获GTI Awards移动技术创新突破奖

    名单正式揭晓,其中,高通技术公司最新旗舰移动平台第三代骁龙8凭借其卓越的技术创新和领先的市场表现,荣获了GTI Awards移动技术创新突破奖。
    的头像 发表于 03-01 09:31 755次阅读

    无线数字会议系统的技术创新与影响

    无线数字会议系统在近年来取得了显著的技术创新,这些创新不仅提高了会议的效率和效果,也对整个行业产生了深远的影响。本文将深入探讨无线数字会议系统的技术创新及其带来的影响。
    的头像 发表于 01-23 15:19 656次阅读