0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌提出FlexiViT:适用于所有Patch大小的模型

CVer 来源:CVHub 作者:CVHub 2022-12-20 13:42 次阅读

太长不看版,果然还是延续谷歌的风格,创新不够,实验来凑。

废话不多说,直接上图,一图胜千言:

c6e4c8c0-8024-11ed-8abf-dac502259ad0.png

FlexiViT

顾名思义,FlexiViT,翻译过来不就是灵活的 ViT 嘛?

Ooo,那怎么体现灵活?我们先回顾下 Vision Transformers 的工作流程。

一句话总结就是,ViT 是一种通过将图像切割成一个个小方块(patch)将图像转换为序列从而输入到Transformer网络进行训练和推理的一种神经网络架构。

本文的重点便是在研究这些小块块对性能的最终影响。通常来说:

方块切的越小,精度会越高,但速度就变慢了;

方块切的越大,精度会降低,但速度就上来了;

So,我们究竟是要做大做强,还是做小做精致?不用急,来自谷歌大脑的研究人员为你揭晓答案:成年人才做选择,老子大小通吃。

正经点,让我们切回来,古哥通过燃烧了数不尽的卡路里向我们证明了,在训练期间随机改变方块的大小可以得到一组在广泛的方块大小范围内表现良好的权重(泛化性能好)。

这结论有什么用?那便是使得在部署时大家可以根据不同的计算预算来调整模型。

通过在以下五大版图进行广泛的投资,可以清晰的发现收益率远超沪深300:

图像分类

图像-文本检索

开放世界检测

全景分割

语义分割

c7162d34-8024-11ed-8abf-dac502259ad0.png

c780db7a-8024-11ed-8abf-dac502259ad0.png

为了照顾下你们这些散(韭)户(菜),古哥说你们可以将它任意添加到大多数依赖ViT骨干架构的模型来实现计算自由,即模型可以根据不同的计算资源调整自己的工作方式,从而获得更好的性能和效率。

说了这么多,怎么做?直接把代号都发给你了,明天早盘直接梭哈即可:

c7c41764-8024-11ed-8abf-dac502259ad0.png

看到看到这里了,总不能白嫖吧?点个赞友情转发下再走咯~~~

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6142

    浏览量

    105155
  • 图像
    +关注

    关注

    2

    文章

    1083

    浏览量

    40427
  • 模型
    +关注

    关注

    1

    文章

    3181

    浏览量

    48753

原文标题:谷歌提出FlexiViT:适用于所有Patch大小的模型

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA推出适用于网络安全的NIM Blueprint

    德勤使用适用于容器安全的 NVIDIA NIM Agent Blueprint 帮助企业利用开源软件构建安全的 AI。
    的头像 发表于 11-20 09:58 175次阅读

    适用于TMS320C5504/05的电源

    电子发烧友网站提供《适用于TMS320C5504/05的电源.pdf》资料免费下载
    发表于 10-11 11:18 0次下载
    <b class='flag-5'>适用于</b>TMS320C5504/05的电源

    7MFL5430-2AA10雷达波料位计适用于哪些物料

    雷达波料位计适用于多种物料的测量,包括液体、浆料、颗粒料和固体块状物料等。同时,它还适用于各种恶劣环境和变化环境,广泛应用于多个行业领域。
    的头像 发表于 10-08 16:11 171次阅读

    适用于工业应用的使用MDIO的以太网PHY配置

    电子发烧友网站提供《适用于工业应用的使用MDIO的以太网PHY配置.pdf》资料免费下载
    发表于 09-21 10:24 0次下载
    <b class='flag-5'>适用于</b>工业应用的使用MDIO的以太网PHY配置

    选择适用于汽车应用的基准电压

    电子发烧友网站提供《选择适用于汽车应用的基准电压.pdf》资料免费下载
    发表于 09-02 11:26 0次下载
    选择<b class='flag-5'>适用于</b>汽车应用的基准电压

    适用于AR眼镜的TI DLP® Pico™技术

    电子发烧友网站提供《适用于AR眼镜的TI DLP® Pico™技术.pdf》资料免费下载
    发表于 08-23 09:21 0次下载
    <b class='flag-5'>适用于</b>AR眼镜的TI DLP® Pico™技术

    LMP91051是否适用于Pyreos的双通道?

    LMP91051是否适用于Pyreos的双通道(两颗sensor集成在同一封装中,共用电源和地)热释电红外传感器
    发表于 08-19 07:17

    谷歌发布用于辅助编程的代码大模型CodeGemma

    谷歌发布了用于辅助编程的代码大模型 CodeGemma。CodeGemma 基于谷歌今年 2 月发布的轻量级开源大模型 Gemma,针对 G
    的头像 发表于 04-17 16:07 648次阅读
    <b class='flag-5'>谷歌</b>发布<b class='flag-5'>用于</b>辅助编程的代码大<b class='flag-5'>模型</b>CodeGemma

    微软正式发布适用于Windows的Sudo

    微软已在 Windows 11 Insider Preview Build 26052 中发布适用于 Windows 的 Sudo,并将其在 MIT 协议下进行开源。
    的头像 发表于 03-19 09:20 809次阅读
    微软正式发布<b class='flag-5'>适用于</b>Windows的Sudo

    适用于所有尺寸TV的完全I2C可编程6通道LCD偏置IC TPS65177/A数据表

    电子发烧友网站提供《适用于所有尺寸TV的完全I2C可编程6通道LCD偏置IC TPS65177/A数据表.pdf》资料免费下载
    发表于 03-07 13:47 0次下载
    <b class='flag-5'>适用于</b><b class='flag-5'>所有</b>尺寸TV的完全I2C可编程6通道LCD偏置IC TPS65177/A数据表

    谷歌模型合成工具在哪下载安装

    谷歌模型合成工具通常不是作为一个独立的软件产品提供下载和安装的。相反,它们可能是作为谷歌云平台的一部分,通过云服务的方式提供。以下是一些可能适用于
    的头像 发表于 03-01 18:16 1636次阅读

    谷歌模型框架是什么软件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌开发的用于机器学习和人工智能的软件框架,其中最著名的是TensorFlow。TensorFlow是一个开源的机器学习框架,由
    的头像 发表于 03-01 16:25 820次阅读

    是否有适用于CYBT-343026-01的SPICE型号?

    您是否有适用于 CYBT-343026-01 的 SPICE 型号? 该模块将在本质安全应用中使用,并且需要知道内部电容/电感。
    发表于 03-01 07:56

    谷歌模型合成软件有哪些

    谷歌模型合成软件通常指的是谷歌提供的用于创建、修改和共享3D模型的软件。目前,谷歌推出的
    的头像 发表于 02-29 18:20 1355次阅读

    谷歌交互世界模型重磅发布

    谷歌模型
    北京中科同志科技股份有限公司
    发布于 :2024年02月28日 09:13:06