0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI另一个重大领域视觉的GPT时刻何时到来?

微云疏影 来源:综合整理 作者:综合整理 2023-06-02 10:47 1239次阅读

5月28日,北京智源人工智能研究院在2023年中关村论坛并行论坛之一的人工智能大规模模型发展论坛上发布了通用分割模型seggpt (segment everything in contex)。这是一种利用prompt(视觉提示)完成任意分割工作的通用视觉模型。

seggpt是一个基于支持通用视觉模型painter的模型,它优化了所有物体的分割。seggpt具有上下文推理功能,即使没有细微的调整,只要提供示例,就可以自动进行推理和相应的分割工作。示例包括示例、类、部件、轮廓、文本、面部、医疗图像等。它灵活的推论能力足以提供许多视觉线索。自动视频分割和追踪功能:seggpt以第一个框架的图片和对象屏蔽为上下文单位,可以自动分割下一个视频框架,并使用屏蔽颜色作为对象id自动追踪。

seggpt与推出ai图像分割基础模型sam的meta不同,sam使用的是通过一个点或边框相互提示预测图像,识别分割画面上的特定物体的“one touch touch”方式。seggpt通过提示一个或多个示例图像和意图面具来掌握用户的意图,并根据意图进行分割等操作。只要用户在画面上表示识别一种物体,无论是现在的画面还是其他画面,都可以定量地识别和分割同类物体。

“一触即通”或“一通百通”意味着视觉模型理解了形象结构。sam的精细脚注功能与seggpt的通用分割脚注功能相结合,可以在像素排列中分析任何图像,以像生物视觉一样理解任何场景。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30830

    浏览量

    268995
  • 视觉模型
    +关注

    关注

    0

    文章

    7

    浏览量

    6911
  • GPT
    GPT
    +关注

    关注

    0

    文章

    354

    浏览量

    15360
收藏 人收藏

    相关推荐

    RISC-V在AI领域的发展前景怎么样?

    随着人工智能的不断发展,现在的视觉机器人,无人驾驶等智能产品的不断更新迭代,发现ARM占用很大的市场份额,推出的ARM Cortex M85性能也是杠杠的,不知道RISC-V在AI领域有哪些参考方案?
    发表于 10-25 19:13

    tpa3255声道正常,另一个声音大就保护,为什么?

    TPA3255,2XBTL 模式,其中声道正常,另一个大动态时FAULT保护,OTW不亮.两声道带4R电阻负载测试都正常,280W左右,OTW会亮,几十秒后超温亮FAULT灯.
    发表于 10-11 06:43

    英伟达预测机器人领域或迎“GPT-3时刻

    未来2-3年内,机器人基础模型的研究将迎来重大突破,这一时刻被形象地比喻为机器人领域的“GPT-3时刻”。
    的头像 发表于 09-20 17:05 793次阅读

    Jim Fan展望:机器人领域即将迎来GPT-3式突破

    英伟达科学家9月19日,科技媒体The Decoder发布了则引人关注的报道,英伟达高级科学家Jim Fan在近期预测,机器人技术将在未来两到三年内迎来类似GPT-3在语言处理领域的革命性突破,他称之为机器人
    的头像 发表于 09-19 15:13 571次阅读

    电感的电流能否分流给另一个电感

    电感的电流能否分流给另一个电感,这个问题涉及到电感器的工作原理、特性以及在电路中的应用。 电感器的基本概念 电感器是种被动电子元件,其主要功能是存储能量。电感器由或多个导线绕成的
    的头像 发表于 08-21 10:02 422次阅读

    人手AI是如何诞生的?

    2023年是AI大语言模型爆发的年,以OpenAI推出的GPT大模型为起始,整个行业开始从“推理式AI”向“生成式AI”迈进……
    的头像 发表于 07-23 10:33 213次阅读

    GPT的定义和演进历程

    GPT,全称Generative Pretrained Transformer,是OpenAI公司在自然语言处理(NLP)领域重大创新。这
    的头像 发表于 07-10 10:41 1054次阅读

    如何为SPI OLED显示屏添加另一个设备?

    SPI 数据接口将图像传送到 OLED 显示屏。使用 UVC 应用说明中的说明操作 UVC 部件。如何为 SPI OLED 显示屏添加另一个设备? 谢谢。
    发表于 05-31 06:18

    新火种AI|秒杀GPT-4,狙杀GPT-5,横空出世的Claude 3振奋人心!

    3的出现意味着打开了全新的世界,其系列模型在推理,数学,编码,多语言理解和视觉方面,都树立了全新的行业新基准。 也正是因为Claude 3的出现,全球最强AI模型
    的头像 发表于 03-06 22:22 643次阅读
    新火种<b class='flag-5'>AI</b>|秒杀<b class='flag-5'>GPT</b>-4,狙杀<b class='flag-5'>GPT</b>-5,横空出世的Claude 3振奋人心!

    在tc275上怎么用核触发另一个核产生软中断?

    在tc275上怎么用核触发另一个核产生软中断?
    发表于 02-19 08:14

    新火种AI|GPT Store可能是“硅基人才市场”

    作者:号 编辑:美美 也许我们都错了,GPT Store可能是“硅基人才市场”,而不是APP Store。 如果要说在AI
    的头像 发表于 01-31 09:29 406次阅读
    新火种<b class='flag-5'>AI</b>|<b class='flag-5'>GPT</b> Store可能是<b class='flag-5'>一</b><b class='flag-5'>个</b>“硅基人才市场”

    如何使用BLE将数据从PSOC发送到另一个PSOC?

    我有 PSOC 板(我正在使用 CY8CPROTO-063-BLE )采样数据,我想通过 BLE 将其发送到另一个 PSOC 板。 我需要以 1.024 Mbit/sec 的速率传输数据(我正在
    发表于 01-29 07:53

    路由器是干什么用的 路由器怎样桥接另一个路由器

    路由器是网络设备,用于将数据包从网络传输到另一个网络。它通过控制数据包的路径来实现互联网上多个网络之间的通信。路由器在家庭、办公室和
    的头像 发表于 01-19 17:12 1450次阅读

    电源的正接到另一个电源的负会怎样?为什么?

    电源的正接到另一个电源的负会怎样?为什么? 当电源的正极连接到另一个电源的负极时,会发
    的头像 发表于 01-16 11:06 3688次阅读

    OpenAI GPT 商店即将亮相,SpaceX 新型 Starlink 卫星发射上天

    大家好,欢迎收看河套 IT WALK 第 135 期。 在 2024 年第周即将结束之际,OpenAI 宣布即将推出备受期待的 GPT 商店。SpaceX 在卫星通信领域实现了重大
    的头像 发表于 01-05 21:15 614次阅读
    OpenAI <b class='flag-5'>GPT</b> 商店即将亮相,SpaceX 新型 Starlink 卫星发射上天