0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

质疑大模型,理解大模型,用上大模型

物联传媒 来源:物联传媒 2023-08-23 14:53 次阅读

2023年,以聊天机器人ChatGPT爆火为代表,起起伏伏、整体向上的人工智能产业迎来了大模型时代。

回溯过往,人工智能的发展经历了三个阶段:

第一次是上世纪末的专家系统时代,特征是将专家的领域知识转变为计算机模型,用以推理并得出与专家相同的结论。

第二次是不久前的“机器学习+深度学习”时代,在以CNN、RNN为代表的神经网络的赋能下,比如车牌识别、人脸识别这类计算机视觉应用,识别准确率从过去的92%、93%,提高到了99%以上,在该阶段有部分产品彻底实现了产品化、规模化应用。

第三次即是眼下的大模型时代,起源是2017年谷歌发表的一篇论文《AttentionIsAllYouNeed》,里面提出了革命性的Transformer深度神经网络,一举将深度学习的模型参数提高到了上亿级别,并且在之后的迭代发展中,模型参数被逐步提升到了几十亿、几百亿甚至几千亿,意味着模型的复杂程度和学习能力逐步提高,越来越有接近人的表现。

换句话说,大模型产品并非采用上个时代模型参数受限的CNN、RNN架构,而是借助Transformer另起炉灶,达到了一种类似“小孩开窍”的「涌现」现象——当模型突破某个规模时,能力水平直线上升。

这样一来,大模型能做的事情变得更多了,并且效果更好,比如文本生成、语言理解、知识对话、逻辑推理等等。

再由于Transformer是一项新技术,无论是传统玩家还是新兴企业都处在接近的起跑线,所以业界参与大模型的玩家非常多、类型非常广,各方都希望通过大模型抓住新一轮产业机会。

此时,为了深入探究大模型与物联网行业是否存在关联?大模型是否将创新IoT产品或改善企业流程?物联传媒记者特别采访了中科创达物联网事业群副总裁杨新辉先生,基于中科创达近来在大模型领域的诸多动作,询问行业及企业的详细信息,希望增进大众对大模型的了解。

中科创达大模型产品基本信息一览:

产品名称:中科创达魔方RUBIK大模型

产品定位:为行业客户的智能化升级提供AI赋能

产品规划:全面覆盖了从边缘端(RUBIK Edge)、语言大模型(RUBIK Language)、多模态(RUBIK Multi-Modal)、机器人(RUBIK Robot)等大模型系列,并积极探索大模型在不同行业场景的落地应用。

以下是杨总和物联传媒的对话精选。

Part 1:

中科创达的大模型产品特征

物联传媒:根据2022年财报,中科创达的营收可以分出三类来源,分别是智能软件业务、智能汽车业务、智能物联网业务,三者营收占比均接近三分之一,并且智能物联网业务较上年同期增长39%,增长仅次于汽车业务。请问对于智能物联网业务,可否向我们简单分享它的起源与发展方向。

杨新辉:中科创达成立于2008年,是全球领先的智能操作系统产品和技术提供商。得益于移动互联网时代来自智能手机的爆发式需求,中科创达业绩快速增长并于2015年在深交所上市。随着发展向前推进,物联网行业兴起,中科创达物联网业务最早开始于2016年,寄托了我们将操作系统从智能手机推进到物联网的目标。

我们物联网业务的定位是硬件产品及解决方案提供商,覆盖从智能模组、参考设计、到整机,再到物联网平台的端到端完整方案。但中科创达的优势还是操作系统及基于操作系统构建的软件和解决方案,包括端侧、边缘侧操作系统,再加上AI算法、平台管理能力。

4f897f56-4166-11ee-a2ef-92fbcf53809c.png

物联传媒:在所有业务中,了解到大模型是公司比较新的一项业务,公司基于哪些原因推出了大模型?

杨新辉:主要是基于对产业发展的洞察,大模型有望推动产业产生结构性的变化,虽然这还是一件长远的事,但我们看得到趋势正在形成,中科创达也愿意拥抱、布局新兴技术来给产业赋能。

物联传媒:公司大模型产品的定位和用途是什么?

杨新辉:我们的大模型产品叫中科创达魔方RUBIK大模型,定位是在边缘侧和端侧产品上优化交互,以及面向企业提供基于模型的AI服务。

为方便理解,可以将我们的业务拆分为两部分:

一部分是产品创新,就是传统的手机、汽车、物联网业务,会通过大模型把AI能力补充上去,以创新内容交互的形式提高产品价值。比如市面上常见的语音实时转写终端,加入大模型能力后可以新增语篇规整、生成摘要、生成纪要等能力,显著提高一些岗位的工作效率;再比如汽车场景,传统座舱内不少用户困扰于繁杂的表盘信息,加入大模型能力后,智能座舱的出现为用户提供更直观、准确的交互和指导,跨越式提高了用户体验。

另一部分是流程创新或称为企业数字化转型,这部分的热门应用有智能客服、直播数字人等等。

物联传媒:现在中科创达魔方RUBIK大模型的应用规模如何?

杨新辉:坦白讲现在整个大模型行业都还处于发展早期,B端客户们也都还在理解、认知、思考、学习和研究大模型的阶段,用量方面还有很大增长空间。

但中科创达也都一直在努力推动应用落地。

今年6月,我们与高通合资成立的公司创通联达推出了旗下首款集成大模型的智能搬运机器人解决方案,使用户可以通过自然语言与智能搬运机器人交互,提出服务指令。

7月份,我们与北京智源人工智能研究院共同成立“魔方未来联合实验室”,希望推进大模型技术创新与成果转化,促进技术在智能汽车、智能机器人、智慧工业、智能物联网等领域的应用落地。

4ff5b81a-4166-11ee-a2ef-92fbcf53809c.png

Part2:

大模型与物联网行业的相关性

物联传媒:会不会存在场景不需要用到大模型,直接用之前一代的人工智能版本就够了呢?

杨新辉:这种情况是存在的。比如前面提的人脸识别、车牌识别应用,行业的成本、效率都足够好了,大模型就不需要往那个领域创新。但比如多轮对话,要让对方感知不到是机器人,就需要更换为大模型。大模型解决的是以前技术无法解决的问题。

物联传媒:我们前面聊了ChatGPT是一种大语言模型应用,但在实际的使用中,我个人感觉它在垂直领域产出有思想、有深度的内容还依然有不足。

杨新辉:对,这方面它还不是说要完全取代,但是大模型完全可以做好一个助理的角色了,包括收集过去的信息、整理资料、列出框架,并且耗时非常短。比如说写高考作文,人写完需要30分钟,大模型只需要30秒。

而且我们认为,大模型的重要性是可以比拟工业革命时期蒸汽机的出现。当时,以蒸汽机为动力的机械使纺纱、织布工序从人工转向自动,可能产生了10倍以上的产能提升;现在大模型出现,也在主打对智力工作进行替代或显著增强。

打个比方,我们把人工智能的技术能力想象为一个水平面,技术的成熟和完善相当于水平面不断被抬高,以至于盖过了一些岛屿和陆地,这些岛屿和陆地就是人类承担的部分工作。

这种情况下,假设说基于CNN、RNN技术构建的人脸识别、车牌识别等应用可以算是小模型,替代了10%的人类工作;那么到大模型应用里,对人类工作的替代率就可以达到30%-40%。

比例数据仅做参考,但根本上来说,大模型确实比此前几代人工智能技术能做的事情更多了,甚至现在新型的大模型可以去通过图灵测试,比如一些客服电话,可能当我们发现是机器人的时候,其实这个电话已经把想传达、想询问的信息说清楚了。

物联传媒:除了互联网应用,大模型将最先在哪些物联网场景有应用潜能?

杨新辉:今天我们谈的大模型浪潮主要还是在AIGC大的范畴里,即基于人工智能做内容产生。物联网场景里有内容产生的地方,比如说跟人有反复交互的产品类型,不管是语言还是图像形式,大模型就会有突出的应用价值。

物联传媒:既然行业整体处于发展早期,公司在该赛道上有哪些具体规划?

杨新辉:我们的模型会做一个长期的工作。

今年是先从语言模型开始,从百亿规模参数一直到千亿规模参数,大概会做五、六个档次。其中参数规模相对最小的一类(比如说70亿、130亿或者300亿以下参数),主要用在边缘和端侧设备上,这也是我们业务发展的重点。

到明年中期,预计多模态产品会出来,到时不止覆盖语言,也会覆盖图像类应用,并且这些产品也将逐步应用在边缘端和机器人领域。

物联传媒:我们应该怎么想象和理解大模型的发展潜能?

杨新辉:从产品角度来看,大模型就是一个软件形态的生产效率工具,把它用上去了,工作效率有望大幅提升。

从更产业化的角度来说,市面上好多需求都是由新技术来驱动的,因为没有新技术,用户没有替换的动力。大模型就是一项新技术。

比如现在我们看到一些品牌在酝酿、研发大模型手机,原因是用户换机的意愿已经大幅降低,当未来大模型手机产品出来并且切中用户痛点、爽点的时候,那就会驱动整个行业都用上大模型。其他很多行业也与此相似,大模型技术具有非常大的发展空间。

Part3:

大模型的建设与选型

物联传媒:您觉得大模型有没有技术门槛?

杨新辉:大模型的技术门槛其实很高,壁垒主要有三个——数据、算力和算法,这三者分别代表了数据获取及清理能力、投入资金水平、技术复杂度,除了部分头部企业,很多公司无法长期投入在所有这些事上。

物联传媒:在客户了解大模型产品时,势必会看到行业中有不少开源产品,您是如何看待开源大模型的?

杨新辉:现在开源模型的确有很多,可能初步能满足用户使用的需求,但在商业场景,开源产品存在的风险不容忽视。

举个简单的例子,国外的开源模型可能就没有做过与国内价值观、风俗文化等方面的对齐,这才有模型区域化的趋势,很难存在一个模型全球都好用。

另一方面,我们认为大模型并非是一个直接套用的标准化产品,它的商业模式更多是“产品+服务”,所以大模型应该有很多服务阶段,比如对企业业务的咨询、对数据的理解、对模型的训练/部署/调优,本质上是一个非常复杂的工作,需要有非常复杂的、全栈的技术团队才能把这件事做出来,这不是开源产品能保证效果的。

物联传媒:结合现在热闹的情况,您认为最终行业会留下多少大模型?

杨新辉:通用模型可能只会剩下几个,但是在垂直行业领域,面向不同的数据基础会存在很多的领域模型。

领域模型与通用模型的区别,就好像专科医生与普科大夫,专科医生势必在专业领域里能力更强,并且会有非常多类型的专科医生。

物联传媒:中科创达大模型产品的定位是专科医生还是普科大夫?

杨新辉:我们还是会先训练出一个普科大夫。因为从根本上说,中科创达的定位是提供基础的、底层的技术,以第三方平台的身份,帮助垂直领域有数据资产的企业更快构建属于他们自己的模型而不用从0开始。

当然,后期当我们参与的行业、服务的企业、经验的积累足够多时,也就有机会直接向他们提供专业的垂直行业模型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4762

    浏览量

    100535
  • 人工智能
    +关注

    关注

    1791

    文章

    46845

    浏览量

    237535
  • 机器学习
    +关注

    关注

    66

    文章

    8377

    浏览量

    132406
  • 大模型
    +关注

    关注

    2

    文章

    2322

    浏览量

    2479

原文标题:质疑大模型,理解大模型,用上大模型

文章出处:【微信号:ulinkmedia,微信公众号:物联传媒】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    模型动态测试工具TPT的软件集成与测试支持#Siumlink模型测试 #TPT

    模型
    北汇信息POLELINK
    发布于 :2024年11月07日 11:20:29

    理解LLM中的模型量化

    在本文中,我们将探讨一种广泛采用的技术,用于减小大型语言模型(LLM)的大小和计算需求,以便将这些模型部署到边缘设备上。这项技术称为模型量化。它使得人工智能模型能够在资源受限的设备上高
    的头像 发表于 10-25 11:26 176次阅读
    <b class='flag-5'>理解</b>LLM中的<b class='flag-5'>模型</b>量化

    摩尔线程正式开源音频理解模型MooER

    近日,国内领先的GPU创新企业摩尔线程宣布了一项重大技术突破——正式开源其自主研发的音频理解模型MooER(摩耳)。这一举动标志着我国在音频处理与理解领域迈出了坚实的一步,特别是在基于国产硬件的AI
    的头像 发表于 08-27 15:24 459次阅读

    什么是大模型?快速了解大模型基本概念

    “在人工智能的世界里,大模型就像超级大脑一样,能够处理和理解大量的信息。你可能听说过ChatGPT,它就是大模型的一个典型代表。那么,什么是大模型呢?让我们一起来探索这个神奇的领域。什
    的头像 发表于 08-07 08:28 1324次阅读
    什么是大<b class='flag-5'>模型</b>?快速了解大<b class='flag-5'>模型</b>基本概念

    【《大语言模型应用指南》阅读体验】+ 基础知识学习

    今天来学习大语言模型在自然语言理解方面的原理以及问答回复实现。 主要是基于深度学习和自然语言处理技术。 大语言模型涉及以下几个过程: 数据收集:大语言模型通过从互联网、书籍、新闻、社交
    发表于 08-02 11:03

    Al大模型机器人

    理解能力强大: AI大模型机器人可以理解和生成自然语言,能够进行复杂的对话和语言任务。它们能够识别语言中的语义、语境和情感,并据此作出适当的回应。广泛的知识储备: 这些模型基于大规模的
    发表于 07-05 08:52

    大语言模型(LLM)快速理解

    自2022年,ChatGPT发布之后,大语言模型(LargeLanguageModel),简称LLM掀起了一波狂潮。作为学习理解LLM的开始,先来整体理解一下大语言模型。一、发展历史大
    的头像 发表于 06-04 08:27 901次阅读
    大语言<b class='flag-5'>模型</b>(LLM)快速<b class='flag-5'>理解</b>

    大语言模型:原理与工程时间+小白初识大语言模型

    解锁 我理解的是基于深度学习,需要训练各种数据知识最后生成自己的的语言理解和能力的交互模型。 对于常说的RNN是处理短序列的数据时表现出色,耳真正厉害的是Transformer,此框架被推出后直接
    发表于 05-12 23:57

    【大语言模型:原理与工程实践】大语言模型的应用

    ,它通过抽象思考和逻辑推理,协助我们应对复杂的决策。 相应地,我们设计了两类任务来检验大语言模型的能力。一类是感性的、无需理性能力的任务,类似于人类的系统1,如情感分析和抽取式问答等。大语言模型在这
    发表于 05-07 17:21

    【大语言模型:原理与工程实践】大语言模型的评测

    的工具。通过这一框架,研究人员和使用者可以更准确地了解模型在实际应用中的表现,为后续的优化和产品化提供有力支持。针对语言理解类评测任务,特别是古文及谚语理解,我们深入评估了模型在中文特
    发表于 05-07 17:12

    【大语言模型:原理与工程实践】探索《大语言模型原理与工程实践》2.0

    《大语言模型“原理与工程实践”》是关于大语言模型内在机理和应用实践的一次深入探索。作者不仅深入讨论了理论,还提供了丰富的实践案例,帮助读者理解如何将理论知识应用于解决实际问题。书中的案例分析有助于
    发表于 05-07 10:30

    【大语言模型:原理与工程实践】大语言模型的基础技术

    全面剖析大语言模型的核心技术与基础知识。首先,概述自然语言的基本表示,这是理解大语言模型技术的前提。接着,详细介绍自然语言处理预训练的经典结构Transformer,以及其工作原理,为构建大语言
    发表于 05-05 12:17

    【大语言模型:原理与工程实践】揭开大语言模型的面纱

    大语言模型(LLM)是人工智能领域的尖端技术,凭借庞大的参数量和卓越的语言理解能力赢得了广泛关注。它基于深度学习,利用神经网络框架来理解和生成自然语言文本。这些模型通过训练海量的文本数
    发表于 05-04 23:55

    【大语言模型:原理与工程实践】探索《大语言模型原理与工程实践》

    《大语言模型》是一本深入探讨人工智能领域中语言模型的著作。作者通过对语言模型的基本概念、基础技术、应用场景分析,为读者揭开了这一领域的神秘面纱。本书不仅深入讨论了语言模型的理论基础,还
    发表于 04-30 15:35

    大语言模型简介:基于大语言模型模型全家桶Amazon Bedrock

    本文基于亚马逊云科技推出的大语言模型与生成式AI的全家桶:Bedrock对大语言模型进行介绍。大语言模型指的是具有数十亿参数(B+)的预训练语言模型(例如:GPT-3, Bloom,
    的头像 发表于 12-04 15:51 748次阅读