0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

知行科技大模型研发体系初见效果

知行科技iMotion 来源:知行科技iMotion 2024-12-27 09:38 次阅读

数据的质量和规模才是端到端的“命脉”

11月,知行科技作为共同第一作者提出的Strong Vision Transformers Could BeExcellent Teachers(ScaleKD),以预训练ViT(视觉Transformer)模型作为教师,CNN网络作为学生进行学习。推进异构神经网络间知识蒸馏研究的具体范式/方法,被收录于NeurIPS 2024(第38届神经信息处理系统会议)。

这是知行科技构建大模型体系能力的初步成果之一。2024年年中,知行科技开始从资源、组织等多线程入手,打造面向大模型的研发架构体系,并完成组织架构调整,引入包括清华大学计算机博士背景的大模型架构师等多位大模型与自动驾驶领域专家,构建起对齐主流的研发组织架构和专家人才库,为2025落地端到端大模型系统上车做好准备。

01构建以数据为中心的开发体系

端到端让所有智驾玩家有机会重新站上起跑线,但做端到端的挑战并不全在于“模型”本身。

特斯拉FSD研发负责人Andrej Karpathy曾表示,特斯拉自动驾驶部门将3/4的精力用在采集、清洗、分类、标注高质量数据上,只有1/4用于算法探索和模型创建。究其原因,数据是人工智能发展的燃料,而端到端大模型将AI的“油耗”水平推到了新的高度。

“100万个视频 Case 训练,勉强够用;200万个,稍好一些;300万个,就会感到Wow;到了1000 万个,就变得难以置信了。”特斯拉创始人马斯克曾这样量化FSD的训练数据需求。

问题是,虽然人类活动生生不息,有效数据却不是源源不断。ChatGPT 3 的开发文档中提到,45TB的纯文本质量过滤后,仅获得570GB的文本,有效数据仅为1.27%。大语言和多模态模型领域已经开始出现高质量的真实文本、视频数据耗尽,性能撞墙的情况。

对自动驾驶来说,高质量的数据多来自罕见路况和场景,产生条件苛刻,导致样本量相对语言类更为稀缺,更是难以满足大模型的参数需求。

目前,端到端自动驾驶系统上车带来更上限的同时,也开始遭遇数据分布问题、高质量数据不足,导致的部分场景性能回退、困难场景性能不稳定的情况。

数据的质量和规模才是端到端的“命脉”。知行科技在进入端到端赛道时,决定构建“以数据为中心”的研发体系,用以满足大模型对高质量数据“贪婪”的特性。

知行科技重构研发组织架构,形成大模型、模型部署、基础设施、大数据等多模块在内的主流人工智能开发框架。其中,大模型组不仅在模型层面提供新的技术支持,在数据自动标注算法、基于扩散模型的数据生成、基于多模态大模型的数据挖掘方面也都有发力,以更低成本的数据生产为目标,保质保量地满足知行科技端到端大模型的数据需求。

02仿真数据,数据战争的下一步

当数据需求是百万clips起步时,应该如何打这场数据战争?

知行科技一方面强化自有数据采集和标注能力,并与生态伙伴形成一定程度的数据协同;

在数据采集方面,知行科技已自建采集车队,自主搭建数据采集软件、车端采集系统和后端耦合系统,实现数据采集全链条的自动化和高度可控,日采集效率达20万帧,为BEV行泊车功能闭环量产提供必要的数据支持。

在数据标注方面,知行科技已经建成自动化标注体系并在不断地完善,在OD(障碍物检测)、LD(车道线检测)项目中实现完全自动标注,整体减少至少50%的数据标注成本。

与此同时,面向端到端系统海量数据需求,知行科技则借助大模型的能力,探索仿真数据的产业应用前景。

12月,OpenAI和谷歌先后发布了视频产品,提供文本、图像、视频转视频的功能,展现出扩散模型等大模型对现实世界极强的复现和“改写”能力。事实上,包括特斯拉在内的自动驾驶头部玩家,也已正在加大仿真数据领域的投入。

因为,仿真数据在数据生产降本,和稀有场景数据获得方面,有着至关重要的作用:

经过良好预训练的大模型能够“向前”,渲染复制现实世界生成图像,并通过在虚拟世界中车辆动态摆放,仅用几分钟生成成千上万段仿真场景信息;

也能够“向后”推理,基于已有场景和环境信息,进行规划控制的学习,打通整个感知和规划链路;

此外,基于对物理世界的理解,大模型还能够通过改变场景中的关键数值,提升数采场景的有效比例。

目前,知行科技通过大模型进行数据生成已取得阶段性成果:能够使用原图进行天气,光照等条件的修改达到快速扩充真值的目标;通过给定特殊控制量,达到数据生产的目的。通过在自动标注和大模型数据生成方面的全面布局,知行科技在数据生产的降本和质量提升方面,已取得实质性进展。

此外,在数据挖掘方面,知行科技已初步建成ImoGPT-多模态大模型的安全解决方案,通过MoE(混合专家系统)大模型,进行文本理解、图片理解和视频理解。其将在实现场景可解释性、数据挖掘、端到端安全方案等多方面发挥重要作用。

03大模型,有教无类的“良师”

大模型可以是数据的生产者,也可以是端侧小模型的“好老师”。

如ChatGPT解释,凭借庞大的参数量和复杂的结构,大模型能够通过海量数据训练,发现新的、更高层次的特征和模式,表现出未能预测、更复杂的能力和特性,实现智能的涌现。“涌现能力”也是大模型扩大使用场景,提升泛化性的核心。但大模型也存在计算资源消耗巨大、推理速度慢、模型可解释性差的问题,难以被部署在计算和能耗都非常有限的端侧。

如何使端模型也获得相应的知识和泛化能力,知识蒸馏(Knowledge Distillation)技术应运而生:将大模型学到的知识迁移到一个更小的模型中,保持性能的同时降低模型部署难度和计算开销。

知行科技被NeurIPS 收录的ScaleKD,正是一种大模型知识蒸馏方法。

8c6d8532-c371-11ef-9310-92fbcf53809c.png

ScaleKD通过结合三个紧密耦合的组件(交叉注意力投影器,双视图特征模仿和教师参数感知),对齐云端教师模型和端侧学生模型之间的特征计算范式差异、型规模差异和知识密度差异,实现任何目标学生模型在大规模数据集上的时间密集的预训练范式。

这意味着,大模型能够作为“有教无类”的良师,将知识和规律“复制”到端侧模型,大幅提升其性能和泛化性。

从前沿学术研究出发,知行科技将根据实际中使用的端模型,构建对应的老师模型进行训练,获得更强的能力,从而通过知识蒸馏提高端模型的学习效果和速度。

端到端大模型的应用,为智能驾驶玩家带来重新开局的机会。中国的场景复杂性、市场需求,中国团队工程化和应用落地的能力,以及大模型技术领域不断涌现的新能力,使后来者能够快速、确定性地切入赛道。

知行科技着力构建的数据生产能力,积累的高质量数据,将为端到端模型训练提供源源不断的”燃料“,推动智驾功能从“能用”、“好用”,走向消费者“爱用”的未来。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动驾驶
    +关注

    关注

    787

    文章

    13987

    浏览量

    167613
  • 知行科技
    +关注

    关注

    1

    文章

    52

    浏览量

    3564
  • 大模型
    +关注

    关注

    2

    文章

    2760

    浏览量

    3406

原文标题:备战端到端,知行科技大模型研发体系初见效果

文章出处:【微信号:gh_dd1765c34afb,微信公众号:知行科技iMotion】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    相关推荐

    字节豆包大模型团队提出稀疏模型架构

    字节跳动豆包大模型Foundation团队近期研发出UltraMem,一种创新的稀疏模型架构,旨在解决推理过程中的访存问题,同时确保模型效果
    的头像 发表于 02-13 15:25 261次阅读

    知行科技获超2亿元融资,加速AI高阶智驾研发与海外拓展

    近日,知行科技宣布成功完成新一轮超2亿元的融资。这笔资金将主要用于提升其研发能力,特别是在基于人工智能(AI)的高阶智能驾驶、舱驾一体解决方案及产品方面。此外,知行科技还将利用这部分资金升级优化
    的头像 发表于 02-13 14:34 344次阅读

    知行科技完成新一轮超2亿元融资

    知行科技新一轮超2亿元融资将主要用于提升研发能力,包括基于AI的高阶智驾、舱驾一体解决方案及产品,升级优化研发生产设施,进一步扩大海外市场。
    的头像 发表于 02-12 18:18 442次阅读

    知行科技与地平线签署战略合作协议

    和服务。通过深度合作,双方将携手开拓国内外智能驾驶市场,推动智能驾驶技术的普及与应用,为智能驾驶行业的可持续发展贡献力量。 知行科技作为智能驾驶领域的领先企业,一直致力于智能驾驶技术的研发与创新。而地平线则拥有
    的头像 发表于 01-23 16:27 1574次阅读

    知行科技与地平线达成战略合作

    近日,知行科技与地平线正式签署了战略合作协议,标志着双方在智能驾驶技术领域的合作迈出了坚实的一步。 根据协议内容,双方将共同致力于智能驾驶技术的研发与应用。特别是在2025年下半年,基于地平线征程6
    的头像 发表于 01-23 10:52 1492次阅读

    「2024中国AIEV产业智驾创新企业」揭榜,文远知行光荣上榜

    ,这一荣誉不仅是对文远知行多年来在自动驾驶技术研发与创新应用方面的高度认可,更标志着其在推动AIEV(人工智能电动汽车)产业发展进程中发挥着至关重要的作用。文远知行
    的头像 发表于 01-08 11:37 172次阅读
    「2024中国AIEV产业智驾创新企业」揭榜,文远<b class='flag-5'>知行</b>光荣上榜

    南方科技大学OpenHarmony技术俱乐部正式揭牌成立

    科技大学会议中心举行。 嘉宾合影 南方科技大学党委书记姜虹出席大会并发表致辞。她表示,南方科技大学肩负着服务国家战略的重任,积极推动教育、人才、产业与创新链的深度整合。我校电子与电气工程系成功构建了APP开发实践
    的头像 发表于 01-05 19:32 611次阅读
    南方<b class='flag-5'>科技大</b>学OpenHarmony技术俱乐部正式揭牌成立

    文远知行在珠海横琴新设科技公司

    的经营范围相当广泛,涵盖了人工智能理论与算法软件开发、智能机器人的研发等前沿技术领域。这不仅体现了文远知行在技术研发上的深厚实力,也预示着其在未来智能化、自动化领域的持续深耕。同时,公司还涉足汽车零配件批发、汽车销售
    的头像 发表于 12-03 13:44 237次阅读

    知行机器人获诚美资本与中关村智友联合领投

    近日,知行机器人宣布成功完成新一轮融资,本轮融资由诚美资本与中关村智友科学家基金联合领投。此次融资的成功,标志着知行机器人在资本市场上的强劲发展势头,也为其未来的发展注入了新的动力。 知行机器人成立
    的头像 发表于 10-30 10:40 464次阅读

    如何评估AI大模型效果

    评估AI大模型效果是一个复杂且多维度的过程,涉及多个方面的考量。以下是一些关键的评估方法和步骤: 一、基准测试(Benchmarking) 使用标准数据集和任务来评估模型的性能,如GLUE
    的头像 发表于 10-23 15:21 1907次阅读

    文远知行发布全新量产Robotaxi GXR

    自动驾驶科技公司文远知行WeRide近日正式推出了其新一代量产Robotaxi车型——GXR。这款车型被誉为迄今全球最具空间体验感的量产Robotaxi,展现了文远知行在自动驾驶领域的创新能力和技术实力。
    的头像 发表于 10-16 17:46 593次阅读

    商汤科技发布日日新5.5大模型体系

    商汤科技近日震撼发布其最新的日日新5.5大模型体系,标志着人工智能领域又迈出了坚实的一步。该体系以6000亿参数的超大规模基础模型——日日新5.5为核心,性能较上一代实现了显著提升,高
    的头像 发表于 07-08 15:05 693次阅读

    yolox_bytetrack_osd_encode示例自带的yolox模型效果不好是怎么回事?

    、yolox_pre.json 用的都是yolox_bytetrack_s_int8_4b.bmodel模型 效果不好如附件,只识别到左边1个人,右边2人都没识别到 问题1
    发表于 07-05 07:51

    知行科技荣获ISO/IEC 27001信息安全管理体系认证!

    在当今数字化时代,数据已成为企业和组织最重要的资产之一,因此数据安全的重要性不言而喻。知行科技在这方面进行了一系列的布局规划。
    的头像 发表于 05-27 18:10 529次阅读
    <b class='flag-5'>知行</b>科技荣获ISO/IEC 27001信息安全管理<b class='flag-5'>体系</b>认证!

    蒋京芳女士正式加入知行科技并担任总裁!

    2024年4月,蒋京芳女士正式加入知行科技并担任总裁,主要负责公司发展战略落地及经营目标实现,包括业务获取、工程研发、项目交付、生产运营等多方面工作。
    的头像 发表于 05-06 10:24 1585次阅读