0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

让AI抛弃“小作坊”,拥抱“工业化”:盘古大模型究竟是什么?

脑极体 来源:脑极体 作者:脑极体 2021-07-12 21:48 次阅读

如果你想要一台冰箱,结果只能买到压缩机,金属面板、塑料储物盒,需要自己进行组装;如果你想要一台汽车,结果拿到一坨橡胶,需要自己从头造轮胎,你将会是什么心情?

目前AI开发的状态与上面举的例子很像。熟悉AI的朋友知道,AI应用开发是碎片化、定制化的,场景稍有变化就要重新进行数据处理,海量参数调优,反复迭代。如果模型达不到期望的目标,还要把这个过程推倒重来,模型开发周期动辄一个月,甚至数月。这种耗费大量人工的方式说明AI开发还处于作坊模式中。

在2021WAIC期间,华为云盘古预训练大模型被评选为大会的“镇馆之宝”,为AI带来了工业化开发新模式。我们不妨就着“镇馆之宝”四个字,来掰扯掰扯盘古大模型究竟是什么,预训练模型又与AI工业化之间存在着怎样的关联。

4a9b886015c849429038c826f3e4aec0~tplv-tt-shrink:640:0.image

2018年GPT 和 BERT的横空出世,引发了AI行业内外的共同关注。NLP领域的大规模预训练模型,从逻辑上来解释的话,就是采用自监督学习能力在大规模算力的支持下学习海量参数的数据。这不仅让NLP算法能力有了革命性突破,还将大量原本需要用户完成的训练任务预先完成。打个比方,这就像学校先把各种知识教给学生,让他有了基本的行业常识,而不是等到进入企业之后再从头识字,从而降低了企业的培训成本。

如今,大规模预训练模型已经成为全球主流AI厂商、研究机构的“必备功课”,训练参数与算力投入量也水涨船高。OpenAI在2020年发布的GPT-3已经达到了1750亿参数量、上万GPU的惊人训练规模。可以说,大规模预训练模型既要考验厂商的算法创新、调参与优化能力,又是对数据能力、并行计算能力、网络架构能力、开发工具和能力的全面大考。想要让AI在厂商一侧就变成工业化、标准化的“准完成品”,需要投入的技术实力与产业资源都远超大部分AI产品

b03202ba841646b385e613d4ec40d11f~tplv-tt-shrink:640:0.image

想要“镇”住AI工业化中出现的种种挑战,练就真正能解决问题的AI大模型,需要同时具备高效算法、澎湃算力,海量数据吞吐能力基础。

在2021WAIC开幕式上,华为轮值董事长胡厚崑在演讲中介绍了盘古大模型。他认为当前AI的普及应用的瓶颈首先不在技术上,技术已经有了相当的发展,也不在应用上,因为应用的需求都已经蓬勃而出了。它的瓶颈在于开发的效率上,现在的开发效率太低,AI应用的开发太慢,它严重阻碍了技术和需求的结合。

为了提高AI的开发效率,华为云联合伙伴推出了盘古系列预训练大模型,包括业界首个兼具生成与理解能力的中文语言(NLP)大模型和视觉(CV)大模型。

想要具体感知到华为云盘古大模型的能力,我们到WAIC的展馆中一探究竟。盘古大模型在现场展示了成语填空、阅读理解、快速分类三种能力。甚至连 “明明明明明白白白喜欢他,但他就是不说”这种奇葩句子,盘古大模型也能判断出“白白喜欢谁?”“谁喜欢明明?”等问题。

0e054ea198de41b3bfa449bdaa93500a~tplv-tt-shrink:640:0.image

优质的大模型需要三个核心能力,即:可以吸收海量数据的超大型神经网络、强壮的网络结构、优秀的泛化能力。华为云盘古预训练大模型除此之外,还有哪些独特优势呢?

首先,盘古预训练大模型拥有领先的技术创新。

盘古NLP大模型首次使用Encoder-Decoder架构,兼顾NLP理解与生成的能力,且性能领先;在NLPCC生成任务上,Rouge score取得第一,比第二名提升60% 以上。该架构多任务学习的方法,能够让大模型训练更加稳定;同时基于提示的微调, 能够在小样本学习上超越GPT系列。训练盘古NLP大模型使用了40TB的文本数据,包含了大量的通用知识,同时也沉淀了华为云的许多行业经验。盘古CV大模型在业界首次实现了模型的按需抽取,不同部署场景下抽取出的模型体积差异,动态范围可达三个数量级;提出的基于样本相似度的对比学习,凭借小样本学习能力在ImageNet上取得了业界领先的成绩。

其次,盘古预训练大模型拥有丰富的技术沉淀及应用实践。

盘古预训练大模型已经在多个行业、100多个场景成功验证,包括能源、零售、金融、工业、医疗、环境、物流等等。其中,在能源领域,盘古预训练大模型帮助行业客户实现设备能耗的智能控制,可以节约电力成本50%;在金融行业中的异常财务检测,让模型精度提升20%以上; 在尘肺检测中,病例识别准确率提升22%等等。

423b4cc6cd624dadb5a55099e66e9f95~tplv-tt-shrink:640:0.image

盘古已经在近百个行业场景中进行了应用,未来,华为云盘古预训练大模型还将上线华为云AI资产共享社区(AI Gallery),将AI能力进一步开放出来。

既名“盘古”,便应该去开辟一些什么。翻过AI工业化的山丘,彼端每一家企业、每一位开发者的心中都应该有一个“盘古”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30314

    浏览量

    268566
  • 盘古大模型
    +关注

    关注

    1

    文章

    109

    浏览量

    245
收藏 人收藏

    评论

    相关推荐

    PCM1861 INT脚究竟是输出还是输入?

    这个芯片activce或是idle. 是否有人解释下,INT脚究竟是输出还是输入。我希望是输出,我需要读取到是否有analog audio输入的信息。 或者,输入输出与否还要靠其他什么地方设置? 盼望有人回复解答,不胜感激!
    发表于 10-29 07:29

    超高频读写器究竟是什么,能做什么?一文读懂!

    在物联网技术日新月异的今天,超高频读写器作为射频识别(RFID)技术的重要组成部分,正逐渐渗透到我们生活的各个领域。那么,超高频读写器究竟是什么?它又能做些什么呢?本文将带您一探究竟。一、超高频
    的头像 发表于 10-23 14:41 168次阅读
    超高频读写器<b class='flag-5'>究竟是</b>什么,能做什么?一文读懂!

    揭秘贴片功率电感发烫究竟是不是烧坏了

    电子发烧友网站提供《揭秘贴片功率电感发烫究竟是不是烧坏了.docx》资料免费下载
    发表于 09-30 14:44 0次下载

    电感器线径究竟是粗好还是细好

    电子发烧友网站提供《电感器线径究竟是粗好还是细好.docx》资料免费下载
    发表于 09-20 11:25 0次下载

    tas5756m使用GPIO口加内部PLL产生MCLK的方法究竟是怎么样的?

    tas5756m使用GPIO口加内部PLL产生MCLK的方法究竟是怎么样的?
    发表于 08-19 06:06

    华为云盘古汽车大模型通过可信AI汽车大模型评估

    近日,国内科技界传来喜讯,华为云盘古汽车大模型在信通院组织的可信AI汽车大模型首轮评估中脱颖而出,成功获得4+级证书,成为国内首批通过该评估并荣膺当前最高评级的行业大
    的头像 发表于 07-15 17:34 804次阅读

    请问cH340G的TX引脚电平究竟是3v还是5v?

    用CD34G来实现usb转串口的时候,直接用usb口的5v作为电源电压,它的tx引脚输出的高电平究竟是5v还是3v,我实测是3v,但网上有的人是5v,想进一步得到大家的确认。
    发表于 05-14 08:15

    工业模型赋能新型工业化的路径探索

    提供了深刻的理论支撑。当前,人工智能飞速发展,大语言模型(以下简称“大模型”)凭借强大的文本推理和迁移学习能力已成为人工智能发展新的里程碑,有望下沉到研发、生产、运维、测试等制造业各环节,实现对新型工业化的高
    的头像 发表于 05-07 10:36 385次阅读

    工业物联网究竟是什么呢?它又有哪些作用呢?

    随着科技的快速发展,物联网技术已经逐渐渗透到我们生活的各个角落,而 工业物联网(IIoT) 更是引领着工业领域的数字转型。那么,工业物联网究竟是
    的头像 发表于 04-22 15:26 362次阅读

    STM32擦除后数据究竟是0x00还是0xff ?

    STM32擦除后数据究竟是0x00还是0xff ,百度查了许多发现大多数都是0xff的多,都说SD卡(TF)储存介质是Flash 所以擦除后为0xff,但是我遇到了读出来的数据是0x00的情况,为什么呢
    发表于 04-18 07:59

    AI+工业互联网”赋能新型工业化的路径分析

    横看成岭侧成峰,探索“AI+工业互联网”技术赋能新型工业化的路径,还要从技术视角、产业视角、应用视角综合分析。
    的头像 发表于 03-14 10:57 1101次阅读

    吸尘器究竟是如何替你“吃灰”的【其利天下技术】

    如今,吸尘器已成为大多数人居家必备的小家电产品,那么说起吸尘器,你对吸尘器有了解多少呢?不知道大家知不知道它的原理是什么?今天我们就来说一说吸尘器究竟是如何替你“吃灰”的。
    的头像 发表于 03-07 21:17 846次阅读
    吸尘器<b class='flag-5'>究竟是</b>如何替你“吃灰”的【其利天下技术】

    机器人拥抱AI模型已成共识!

    目前普遍的共识是,机器人拥抱AI模型的过程就是具身智能机器人的实现过程,融合AI模型的具身智能机器人将是未来机器人的主要发展方向。
    发表于 12-22 17:08 368次阅读

    打卡智能中国(七):AI的小城故事

    在小城市做AI究竟是一种什么体验
    的头像 发表于 12-19 10:54 807次阅读
    打卡智能中国(七):<b class='flag-5'>AI</b>的小城故事

    同步电机的转数同步究竟是与什么同步啊?

    同步电机的转数同步究竟是与什么同步啊? 所有的同步电机的转数都一样吗?还是与电机的极对数有关系呢?
    发表于 12-19 06:44