0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型发展趋势:多模态、自主智能、边缘智能…

Carol Li 来源:电子发烧友 作者:李弯弯 2024-06-12 00:06 次阅读

电子发烧友网报道(文/李弯弯)近一年多以来,大模型技术和应用都在快速发展。无论是OpenAI、谷歌,还是百度、腾讯、字节等,大模型产品都已经经过了多次迭代,应用也在不断拓展。而接下来,大模型将呈现怎样的发展趋势,仍然是业界关注的重点。日前,在“太湖对话·人工智能+”论坛上,诸多学术界和产业界人士就相关话题进行了深刻探讨。

AI大模型的五个发展方向

在会上,中国工程院院士,清华大学讲席教授、智能产业研究院(AIR)院长张亚勤谈到了AI大模型发展的五个方向。首先是多模态智能,即结合语言、文字、视频、激光雷达点云、3D结构信息、4D时空信息乃至生物信息,实现多尺度、跨模态的智能感知、决策和生成。

其次是自主智能,即将大模型作为一种工具,开发能够自主规划任务、编写代码、调动工具、优化路径的智能体,实现高度的自我迭代、升级和优化,实现自主智能。这里需要考虑模型间如何互相调用、模型如何使用工具、基础模型间如何进行联邦学习等。

如医疗智能体自主进化的模拟医院,他们首次搭建了基于LLM Agent的模拟医院,包含医患两类角色和诊疗八项关键流程。提出不依赖人工标注数据的”MedAgent-Zero”医疗智能自主进化策略。有两种方式自我进化:从正确回答积累样例,从错误回答总结经验。诊断上万模拟病人后,医疗智能体诊断两天相当于医生两年,医学只能体在MedQA子集上达到最优。

第三是边缘智能,将大模型部署到边缘设备端,如AI PC, AI手机,AI电视等,实现高效率、低功耗、低成本、低时延的处理和响应,从而实现边缘智能。

AIR和亚信在这方面已经有都个合作落地案例,如边缘一体机视频分析优化,利用运动向量,增量移动识别框,显著提升目标跟踪性能;大模型推理性能优化,基于运行时参数缓存机制,智能高效地管理MOE模型experts的换入换出,降低显存需求>50%;5G专网算力内生技术,利用基站BBU空闲算力提供服务,基于进程抢占的方法,有效提升BBU算力资源回收效率。

第四是物理(具身)智能:大模型正在被用到无人车、机器人无人机、工厂、交通、 通讯、电网、电站和其他物理基础设施,提升其自动化和智能化水平,从而实现具身智能。张亚勤认为,谈到物理智能,机器人将会是大模型关键的落地方向,无人驾驶其实也是机器人的另一种形式,如支持全地形移动的自稳定送货平台,具有自主学习能力的低速自动驾驶等。

第五便是生物智能,将大模型应用到人脑、生命体、生物体里,实现大模型与生物体连结的生物智能,并最终实现信息智能、物理智能和生物智能的融合。

如AI+生命健康的典型案例,BrainCo脑机接口技术,该项目孵化于哈佛大学创新实验室,由华人团队主创,包括生物医学工程、材料学、脑科学、脑疾病、AI跨学科团队,这种非侵入式脑机接口量产产品登上Time周刊NASA官网。可穿戴脑机接口产品可应用于自闭症,睡眠障碍,闭环正念冥想、抑郁症,阿尔兹海默等。

自主学习、演进的大模型还在研究中

除此之外,在圆桌论坛环节,多位行业人士也就大模型的发展趋势做了详细探讨。阿里云智能首席技术官周靖人谈到,大模型非常明显的一个趋势就是多模态,现在知识体越来越多,不只是只有书本的知识,还有语言,还有视觉看到的物理界的东西,怎么更好地把各种知识体融合在一起是关键。

在他看来,重点需要考虑的是如何让大模型更趋向人类智能,还需要包括记忆体,如何把长期的记忆、短期的记忆都结合在一起。如此,今后就能够让大模型发展成更有个性、更有特点的产品,在不同领域都能够有不同的思考。同时大模型与真实世界有更多互动,相关的信息又会反馈给模型,这让的大模型就能够发展具有自我更新优化的能力。

不过就大模型目前的成熟度而言,还有待研究。周靖人谈到,在IT时代,让信息的获取触手可及,大模型过后,让知识的获取触手可及。现在,一个非常明确的点就是,大模型作为一个助手,它能够提供各种辅导的意见,但最后的决策还是在人,现在这种作为助手的大模型已经做得非常好,这是大模型发展的第一步。

而第二步要实现的是让大模型更为精准,现在大模型的回答还存在很多问题,如何让它十次回答十次都是精准的,周靖人认为这个还有优化空间。更进一步则是,让模型能够自我学习、自我演进,当然这一步目前来说也还在研究中。

澳门产业技术研究院院长、境成资本管理合伙人向江旭谈到,多模态大模型是通向AGI可行的道路。他认为,如何把大模型做到去影响、改变物理世界是一个趋势,如让具身智能(机器人等)成为可能,这也会让日后的养老更加便利。

清华大学惠妍讲席教授、AIR首席科学家马维英谈到了一个很新的角度。他认为,现在大家专注的焦点还是,大模型能看、能听、能写等,而这些方向的机会,主要还是在互联网大厂,如谷歌、微软等。

那么,是否有新的机会呢,不只是生成文章、图片这些。马维英考虑的是,希望不只是把人类只能作为模仿的关键,他认为生物、自然领域也有很多机会值得探索,如生物、化学、材料等,很多新的能源是否能够用AI去合成,在他看来,这些领域在未来十年会有巨大的机会。

写在最后

如今,大模型作为一个工具助手,已经具备非常强大功能,并且已经有了相当成熟的应用。如今大模型具备更多的智能,如GPT-4o,已经能够在于人类的互动中表达感情。而更进一步,大模型要实现自主学习、自主演进,也就是实现自主智能,仍然还需要持续研究。大模型带来的机会方面,除了互联网大厂掌握的文字、图片、视频生成等方面之外,对于新的企业来说,从自然领域,如生物、化学、材料等领域去探索,或许会看到新的机会。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 大模型
    +关注

    关注

    2

    文章

    2134

    浏览量

    1971
收藏 人收藏

    评论

    相关推荐

    智能制造行业现状与发展趋势

    智能制造行业作为现代制造业的重要组成部分,正经历着快速的发展与变革。以下是对智能制造行业现状与发展趋势的详细分析:
    的头像 发表于 09-15 14:26 255次阅读

    云知声推出山海模态模型

    在人工智能技术的浩瀚星海中,模态交互技术正成为引领未来的新航标。继OpenAI的GPT-4o掀起滔天巨浪后,云知声以创新之姿,推出了其匠心独运的山海
    的头像 发表于 08-27 15:20 257次阅读

    依图模态模型伙伴CTO精研班圆满举办

    依图科技多年来深耕人工智能领域,致力于将AI领先技术赋能各行业发展。随着依图天问大模型4.0的发布,依图也开启了大模型合作伙伴业务的新篇章。6月21日,来自全国各地的战略合作伙伴走进依
    的头像 发表于 07-23 15:16 295次阅读

    慕尼黑电子展回顾:启明智显模态硬件智能体引领科技潮流

    人流如织,热闹非凡。模态硬件智能体:未来科技的集大成者展会现场,启明智显隆重推出了其自主研发的模态
    的头像 发表于 07-10 16:17 220次阅读
    慕尼黑电子展回顾:启明智显<b class='flag-5'>多</b><b class='flag-5'>模态</b>硬件<b class='flag-5'>智能</b>体引领科技潮流

    智谱AI发布全新模态开源模型GLM-4-9B

    近日,智谱AI在人工智能领域取得重大突破,成功推出全新开源模型GLM-4-9B。这款模型以其卓越的模态能力,再次刷新了业界对于大型语言
    的头像 发表于 06-07 09:17 547次阅读

    人大系初创公司智子引擎发布全新模态模型Awaker 1.0

    人大系初创公司智子引擎近日震撼发布了新一代模态模型Awaker 1.0,这一里程碑式的成果标志着公司在通用人工智能(AGI)领域取得了重要突破。与前代ChatImg序列
    的头像 发表于 05-06 09:59 467次阅读

    苹果发布300亿参数MM1模态模型

    近日,科技巨头苹果公司在一篇由多位专家共同撰写的论文中,正式公布了其最新的模态模型研究成果——MM1。这款具有高达300亿参数的模态
    的头像 发表于 03-19 11:19 687次阅读

    人工智能十大趋势预测:更多多模态、大模型端侧部署加速!智能化应用呈爆发式增长

    。   而2024年被认为是大模型的应用之年,不难看到,人工智能将会呈现一些明显趋势。如:无论是在消费级还是垂直行业领域,大模型的应用都会加速;在市场应用的驱动下,无论是算力、数据,还
    的头像 发表于 02-18 00:03 3542次阅读

    2024年生成式人工智能五大发展趋势

    2023年是技术发展的分水岭,生成式人工智能成为主流。随着我们进入2024年,预计生成式人工智能格局将迅速演化,引入一系列有望改变技术及其应用的趋势,包括
    的头像 发表于 01-23 09:50 1195次阅读

    自动驾驶和模态大语言模型发展历程

    模态大语言模型(MLLM) 最近引起了广泛的关注,其将 LLM 的推理能力与图像、视频和音频数据相结合,通过多模态对齐使它们能够更高效地执行各种任务,包括图像分类、将文本与相应的视频
    发表于 12-28 11:45 411次阅读
    自动驾驶和<b class='flag-5'>多</b><b class='flag-5'>模态</b>大语言<b class='flag-5'>模型</b>的<b class='flag-5'>发展</b>历程

    人工智能领域模态的概念和应用场景

    随着人工智能技术的不断发展模态成为了一个备受关注的研究方向。模态技术旨在将不同类型的数据和
    的头像 发表于 12-15 14:28 7258次阅读

    模型+模态的3种实现方法

    我们知道,预训练LLM已经取得了诸多惊人的成就, 然而其明显的劣势是不支持其他模态(包括图像、语音、视频模态)的输入和输出,那么如何在预训练LLM的基础上引入跨模态的信息,让其变得更强大、更通用呢?本节将介绍“大
    的头像 发表于 12-13 13:55 1351次阅读
    大<b class='flag-5'>模型</b>+<b class='flag-5'>多</b><b class='flag-5'>模态</b>的3种实现方法

    智能家居市场分析及发展趋势

    电子发烧友网站提供《智能家居市场分析及发展趋势.pdf》资料免费下载
    发表于 11-17 15:19 1次下载
    <b class='flag-5'>智能</b>家居市场分析及<b class='flag-5'>发展趋势</b>

    探究编辑模态大语言模型的可行性

    不同于单模态模型编辑,模态模型编辑需要考虑更多的模态信息。文章出发点依然从单
    发表于 11-09 14:53 399次阅读
    探究编辑<b class='flag-5'>多</b><b class='flag-5'>模态</b>大语言<b class='flag-5'>模型</b>的可行性

    高性能计算与模态处理的探索之旅:英伟达GH200性能优化与GPT-4V的算力加速未来

    随着人工智能技术的不断发展模态模型成为越来越重要的发展趋势。GPT-4V(GPT-4 近日
    的头像 发表于 10-19 10:45 1214次阅读
    高性能计算与<b class='flag-5'>多</b><b class='flag-5'>模态</b>处理的探索之旅:英伟达GH200性能优化与GPT-4V的算力加速未来