谷歌提出FlexiViT：适用于所有Patch大小的模型-电子发烧友网

谷歌提出FlexiViT：适用于所有Patch大小的模型

太长不看版，果然还是延续谷歌的风格，创新不够，实验来凑。

废话不多说，直接上图，一图胜千言：

FlexiViT

顾名思义，FlexiViT，翻译过来不就是灵活的 ViT 嘛？

Ooo，那怎么体现灵活？我们先回顾下 Vision Transformers 的工作流程。

一句话总结就是，ViT 是一种通过将图像切割成一个个小方块(patch)将图像转换为序列从而输入到Transformer网络进行训练和推理的一种神经网络架构。

本文的重点便是在研究这些小块块对性能的最终影响。通常来说：

方块切的越小，精度会越高，但速度就变慢了；

方块切的越大，精度会降低，但速度就上来了；

So,我们究竟是要做大做强，还是做小做精致？不用急，来自谷歌大脑的研究人员为你揭晓答案：成年人才做选择，老子大小通吃。

正经点，让我们切回来，古哥通过燃烧了数不尽的卡路里向我们证明了，在训练期间随机改变方块的大小可以得到一组在广泛的方块大小范围内表现良好的权重（泛化性能好）。

这结论有什么用？那便是使得在部署时大家可以根据不同的计算预算来调整模型。

通过在以下五大版图进行广泛的投资，可以清晰的发现收益率远超沪深300：

图像分类

图像-文本检索

开放世界检测

全景分割

语义分割

为了照顾下你们这些散(韭)户(菜)，古哥说你们可以将它任意添加到大多数依赖ViT骨干架构的模型来实现计算自由，即模型可以根据不同的计算资源调整自己的工作方式，从而获得更好的性能和效率。

说了这么多，怎么做？直接把代号都发给你了，明天早盘直接梭哈即可：

看到看到这里了，总不能白嫖吧？点个赞友情转发下再走咯~~~

审核编辑：李倩

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

谷歌

谷歌

+关注

关注
27

文章
6171

浏览量
105503
图像

图像

+关注

关注
2

文章
1086

浏览量
40493
模型

模型

+关注

关注
1

文章
3255

浏览量
48898

原文标题：谷歌提出FlexiViT：适用于所有Patch大小的模型

文章出处：【微信号：CVer，微信公众号：CVer】欢迎添加关注！文章转载请注明出处。

适用于TCA9511A的EVM用户指南

电子发烧友网站提供《适用于TCA9511A的EVM用户指南.pdf》资料免费下载

发表于 12-23 15:32 •0次下载

<b class='flag-5'>适用于</b>TCA9511A的EVM用户指南

适用于PoE应用的低成本隔离式电源

电子发烧友网站提供《适用于PoE应用的低成本隔离式电源.pdf》资料免费下载

发表于 12-21 09:39 •0次下载

NVIDIA推出适用于网络安全的NIM Blueprint

德勤使用适用于容器安全的 NVIDIA NIM Agent Blueprint 帮助企业利用开源软件构建安全的 AI。

发表于 11-20 09:58 •239次阅读

适用于TMS320C5504/05的电源

电子发烧友网站提供《适用于TMS320C5504/05的电源.pdf》资料免费下载

发表于 10-11 11:18 •0次下载

<b class='flag-5'>适用于</b>TMS320C5504/05的电源

适用于工业应用的使用MDIO的以太网PHY配置

电子发烧友网站提供《适用于工业应用的使用MDIO的以太网PHY配置.pdf》资料免费下载

发表于 09-21 10:24 •0次下载

<b class='flag-5'>适用于</b>工业应用的使用MDIO的以太网PHY配置

选择适用于汽车应用的基准电压

电子发烧友网站提供《选择适用于汽车应用的基准电压.pdf》资料免费下载

发表于 09-02 11:26 •0次下载

适用于AR眼镜的TI DLP® Pico™技术

电子发烧友网站提供《适用于AR眼镜的TI DLP® Pico™技术.pdf》资料免费下载

发表于 08-23 09:21 •0次下载

<b class='flag-5'>适用于</b>AR眼镜的TI DLP® Pico™技术

谷歌发布用于辅助编程的代码大模型CodeGemma

谷歌发布了用于辅助编程的代码大模型 CodeGemma。CodeGemma 基于谷歌今年 2 月发布的轻量级开源大模型 Gemma，针对 G

发表于 04-17 16:07 •715次阅读

<b class='flag-5'>谷歌</b>发布<b class='flag-5'>用于</b>辅助编程的代码大<b class='flag-5'>模型</b>CodeGemma

微软正式发布适用于Windows的Sudo

微软已在 Windows 11 Insider Preview Build 26052 中发布适用于 Windows 的 Sudo，并将其在 MIT 协议下进行开源。

发表于 03-19 09:20 •868次阅读

微软正式发布<b class='flag-5'>适用于</b>Windows的Sudo

适用于所有尺寸TV的完全I2C可编程6通道LCD偏置IC TPS65177/A数据表

电子发烧友网站提供《适用于所有尺寸TV的完全I2C可编程6通道LCD偏置IC TPS65177/A数据表.pdf》资料免费下载

发表于 03-07 13:47 •0次下载

<b class='flag-5'>适用于</b><b class='flag-5'>所有</b>尺寸TV的完全I2C可编程6通道LCD偏置IC TPS65177/A数据表

谷歌模型合成工具在哪下载安装

谷歌模型合成工具通常不是作为一个独立的软件产品提供下载和安装的。相反，它们可能是作为谷歌云平台的一部分，通过云服务的方式提供。以下是一些可能适用于模

发表于 03-01 18:16 •1686次阅读

谷歌模型框架是什么软件？谷歌模型框架怎么用？

谷歌模型框架通常指的是谷歌开发的用于机器学习和人工智能的软件框架，其中最著名的是TensorFlow。TensorFlow是一个开源的机器学习框架，由

发表于 03-01 16:25 •900次阅读

是否有适用于CYBT-343026-01的SPICE型号？

您是否有适用于 CYBT-343026-01 的 SPICE 型号？该模块将在本质安全应用中使用，并且需要知道内部电容/电感。

发表于 03-01 07:56

谷歌模型合成软件有哪些

谷歌模型合成软件通常指的是谷歌提供的用于创建、修改和共享3D模型的软件。目前，谷歌推出的

发表于 02-29 18:20 •1409次阅读

谷歌交互世界模型重磅发布

谷歌模型

北京中科同志科技股份有限公司
发布于 :2024年02月28日 09:13:06

搜索历史