0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ICCV 2023生成式AI引人瞩目,商汤多项技术突破展现中国“创新力”

商汤科技SenseTime 来源:未知 2023-10-04 18:50 次阅读
10月2日至6日,全球AI顶级国际会议ICCV(International Conference on Computer Vision)在法国巴黎举行。本届ICCV投稿总数达8068篇,其中2160篇被接收,录用率为26.8%,略高于上届ICCV 2021录用率25.9%。


商汤科技及联合实验室共49篇论文入选,涵盖文生图、3D数字人、自动驾驶、目标检测视频分割等多个与大模型和生成式AI相关的热点方向。

基于商汤AI大装置SenseCore和“日日新SenseNova”大模型体系。在生成式AI和视觉大模型等领域,商汤提出多项极具价值的技术突破和研究范式创新

商汤科技联合创始人、首席科学家王晓刚表示持续深耕AI基础设施建设、坚持做注重产业实践的学术研究、深耕人才阶梯式培养,是商汤多年来在全球学术舞台上不断产出创新成果的基石。商汤将积极拥抱大模型带来的全新研究范式,不断提升研发体系,坚持将基础研究与业务发展紧密融合,为行业贡献更具价值的技术成果。

多项技术突破和范式创新

大模型及生成式AI成焦点

大模型和生成式AI在全球范围内备受瞩目,也为学术研究提出了诸多具有挑战性的全新课题。

生成式AI方向的文生图领域,如何让模型更容易生成与人类偏好相符的图像?在论文《Human Preference Score: Better Aligning Text-to-Image Models with Human Preference》中,商汤研究团队将人类偏好引入Stable Diffusion的模型训练中,证明了人类偏好信息可以提升Stable Diffusion生成的图像质量,尤其在人体、四肢等经典的failure case中更是展示了优异的效果。

wKgaomUtDvCAEpKfAAC5LWRQ3q4619.jpg将人类偏好引入StableDiffusion的模型训练过程

数字人是生成式AI的重要领域,但其制作依然需要一定门槛。商汤研究团队在论文《SHERF: Generalizable Human NeRF from a Single Image》中提出一种基于单张图片的可泛化、可驱动人体神经辐射场方法,仅需一张任意角度的3D人体图片,结合必要的参数,就能实现3D数字人重建和驱动,有望简化3D数字人的创作流程。

wKgaomUtDvCANNRvAAMkogQRJNI501.png

基于单张图片的人体神经辐射场重建和驱动

高质量的3D人体数据集是研究众多人体相关的感知模型、重建模型和生成式AI的基础。商汤研究团队在论文《SynBody: Synthetic Dataset with Layered Human Models for 3D Human Perception and Modeling》中提出一个合成数据集SynBody,其构建了穿着衣物的参数化人体模型,并生成了海量的人体虚拟数据,有助于3D人体感知和重建的模型训练。此外,团队公布了开源代码库XRFeitoria,一个合成数据渲染工具箱,通过提供方便的Python API与CLI工具,极大简化了制作虚拟数据集的流程。

wKgaomUtDvGACiGhAA2ggPrgJBQ040.pngSynBody是基于分层人体模型的大规模合成

数据集,可用于人体感知与建模等任务

在自动驾驶场景的3D目标检测领域,商汤团队还在论文《Temporal Enhanced Training of Multi-view 3D Object Detector via Historical Object Prediction》中提出一种新的用于多视角3D检测的时序增强训练方式——历史帧物体预测(HoP),不仅在nuScenes测试集上使用ViT-L得到了68.5%NDS和62.4%mAP,超过了排行榜上所有3D物体检测器,还可以即插即用,无缝集成到最先进的 BEV 检测框架中,重塑3D检测时序利用的新范式。

wKgaomUtDvGAYHl5AADe94DmIrg067.jpgHoP算法框架图

此外,本届ICCV,商汤科技还在目标检测、视频分割、3D感知与重建、半监督学习、NeRF等领域取得诸多技术创新突破。

开源开放

构建大模型时代

产学研协同新生态

产学研协同是实现学术研究成果到行业应用转化的高效路径。

商汤不断夯实技术研究的同时,也积极参与和举办各类学术交流和竞赛活动,促进创新成果产出,探索大模型时代产学研协作模式的构建。

同时,商汤长期致力于推动AI基础设施和开源生态的建设,与开发者共创共建,共同推动AI社区的繁荣发展。

商汤早在2018年开源的计算机视觉框架OpenMMLab已在GitHub上收获超过8.7万个星标

今天,商汤的开源项目已拓展到决策智能、大语言模型、拓展现实、数据平台、高性能训练和推理框架、AI智能体框架等领域,为学术界的科研突破和工业界的产业落地提供全方位的算法与平台支撑。

其中,在大语言模型领域,商汤与上海AI实验室等联合推出的书生·浦语大模型(InternLM)在开源社区和产业界产生广泛影响。

最新的InternLM-20B模型性能先进且应用便捷,以不足三分之一的参数量,达到当前被视为开源模型标杆的Llama2-70B的能力水平。

秉承开源、开放的发展理念,商汤愿与行业伙伴共同迎接大模型的新一轮科技革命,让AI技术释放更广泛的产业价值。

wKgaomUtDvGARGkGAAATzh3tzFA448.gif

相关阅读,戳这里

《商汤联合团队斩获CVPR最佳论文,推出首个“感知决策一体化”自动驾驶通用大模型》

wKgaomUtDvGAN7iPAAC4LKEIjVg894.jpg


原文标题:ICCV 2023生成式AI引人瞩目,商汤多项技术突破展现中国“创新力”

文章出处:【微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 商汤科技
    +关注

    关注

    8

    文章

    493

    浏览量

    36057

原文标题:ICCV 2023生成式AI引人瞩目,商汤多项技术突破展现中国“创新力”

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    天玑9400生成AI技术太牛了!打造最强AI体验

    联发科技再度突破技术前沿,推出全新天玑9400旗舰芯片,这是业界首款集成智能体AI的5G SoC。继天玑9300首次将生成
    的头像 发表于 10-14 14:06 219次阅读
    天玑9400<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b><b class='flag-5'>技术</b>太牛了!打造最强<b class='flag-5'>AI</b>体验

    商汤发布《2024生成AI赋能教育未来》白皮书

    生成AI正在各个行业中展现出巨大的应用前景。在关系国计民生的教育行业,生成
    的头像 发表于 06-29 09:48 760次阅读

    请问移动端生成AI如何在Arm CPU上运行呢?

    2023 年,生成人工智能 (Generative AI) 领域涌现出诸多用例。这一突破性的人工智能 (
    的头像 发表于 05-21 17:07 827次阅读
    请问移动端<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>如何在Arm CPU上运行呢?

    摩尔线程与亿景智联达成战略共同,推动生成AI在高等教育中的应用

    得益于大模型技术的不断突破生成AI逐渐成为驱动教育乃至各行各业创新发展的新动力。
    的头像 发表于 05-13 11:35 411次阅读

    商汤集团发布2023全年业绩,全年营收34.05亿

    商汤集团近日发布了2023年经审核全年业绩报告,详细披露了公司在过去一年的业务表现和发展战略。报告指出,商汤集团已经明确了新的三大业务板块:生成
    的头像 发表于 03-29 10:29 577次阅读

    商汤科技2023生成AI收入增至12亿元

    商汤科技近日发布的2023年年报显示,公司在人工智能领域取得显著进展,特别是其“日日新”大模型与大装置的组合,驱动生成AI业务实现了爆发式
    的头像 发表于 03-27 13:51 542次阅读

    商汤集团2023全年业绩亮眼,生成AI业务爆发式增长

    商汤集团近日发布了截至2023年12月31日的经审核全年业绩报告,展现了集团在AI领域的强劲增长势头。在全新的战略布局下,商汤明确了三大业务
    的头像 发表于 03-27 09:14 563次阅读

    奥拓电子荣登“2023粤港澳大湾区企业创新力榜单—创新成就榜”

    在近日召开的第四届深圳企业创新促进大会暨深圳工业总会2023年度年会上,“2023粤港澳大湾区企业创新力榜单”重磅发布,奥拓电子凭借“创新
    的头像 发表于 03-18 13:52 379次阅读
    奥拓电子荣登“<b class='flag-5'>2023</b>粤港澳大湾区企业<b class='flag-5'>创新力</b>榜单—<b class='flag-5'>创新</b>成就榜”

    生成 AI 制作动画:周期短、成本低!

      电子发烧友网报道(文/李弯弯)生成AI在动画市场中的应用正在迅速崛起。根据市场机构数据,预计到2023生成
    的头像 发表于 03-18 08:19 3486次阅读
    <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 制作动画:周期短、成本低!

    联发科天玑又领先一步!强悍AI手机芯片就看天玑!

    近期,2024 世界移动通信大会(MWC 2024)展出的一系列先进通信技术引人瞩目,炙手可热的生成AI
    的头像 发表于 02-27 13:46 475次阅读
    联发科天玑又领先一步!强悍<b class='flag-5'>AI</b>手机芯片就看天玑!

    MediaTek将在MWC 2024展示创新生成AI技术和应用

    MediaTek将亮相2024年世界移动通信大会(MWC 2024),此次大会上,MediaTek将基于其天玑9300集的新一代AI处理器,展示一系列前沿的生成
    的头像 发表于 02-26 10:50 799次阅读

    MediaTek将于MWC 2024展示多项率先亮相的智能手机生成AI应用

    ,MediaTek将展示一系列创新生成AI技术和应用,其中包括多项业界率先亮相的端侧
    发表于 02-21 17:35 253次阅读

    安谋科技赵永超:生成AI加速落地,行业应用创新从“芯”突破

    AI的发展机遇,以及企业要如何面对生成AI的落地难题。   随着ChatGPT等生成
    的头像 发表于 12-26 14:32 1232次阅读
    安谋科技赵永超:<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>加速落地,行业应用<b class='flag-5'>创新</b>从“芯”<b class='flag-5'>突破</b>

    亚马逊云科技全面发力生成AI 2023 re:Invent中国行开启

    北京2023年12月12日 /美通社/ -- 亚马逊云科技在2023 re:Invent全球大会上围绕底层基础设施、生成人工智能(AI)、
    的头像 发表于 12-12 16:13 567次阅读

    辉瑞借助亚马逊云科技云服务和生成AI加速创新

    的主题演讲中登台,介绍了辉瑞正在推进的生成AI相关工作,以及其与亚马逊云科技在过去一年的创新合作成果和未来规划。   辉瑞首席数字和技术
    发表于 12-11 14:17 206次阅读
     辉瑞借助亚马逊云科技云服务和<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>加速<b class='flag-5'>创新</b>