0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一个令人惊艳的ChatGPT项目,开源了!

CodeSheep 来源:CodeSheep 2023-03-31 11:00 次阅读

最近在GitHub上发现了一个爆火的开源项目,star数一顿暴增。

好家伙,凑近一看,居然还是由微软开源,并且和最近炙手可热的ChatGPT息息相关。

项目的名字叫做:Visual ChatGPT。

https://github.com/microsoft/visual-chatgpt

fe346fe4-cf69-11ed-bfe3-dac502259ad0.png

https://github.com/microsoft/visual-chatgpt

这个项目最早是3月上旬微软开源的,项目宣布开源后仅用了短短一周,就斩获了2w+ star。

fe3c0cd6-cf69-11ed-bfe3-dac502259ad0.png

截止到目前,距离当初项目开源仅仅过去了3周多,仓库star数则来到了27k+,亦可谓是火箭式上涨。

众所周知,ChatGPT自2022年11月推出以来,持续走红。

fe62158e-cf69-11ed-bfe3-dac502259ad0.jpg

ChatGPT具备强大的会话能力,可以理解文字、聊天、写小说、解答问题、编写代码... 但是目前还并不能直接处理或生成图像。

而Visual ChatGPT这个项目则可以把ChatGPT和一系列视觉基础模型(VFM,Visual Foundation Model)给联系起来,以便实现在ChatGPT聊天的过程中来发送和接收图像,也使得ChatGPT能够处理更为复杂的视觉任务。

fe73407a-cf69-11ed-bfe3-dac502259ad0.gif

讲白了,就是通过Visual ChatGPT,可以把一系列视觉基础模型给接入ChatGPT,使得ChatGPT能胜任更为复杂的视觉处理任务。

fe90c992-cf69-11ed-bfe3-dac502259ad0.jpg

Visual ChatGPT的整体技术架构图如上所示,我们可以清楚地看到ChatGPT和视觉基础模型(VFM,Visual Foundation Model)分别位于其中的位置。

一方面,ChatGPT(或LLM)作为一个通用接口,继续发挥它本身的优势,提供对不同话题的智能理解。

另一方面,基础视觉模型VFM则通过提供特定领域的深入知识来充当领域专家,它们通过交互管理模块(Prompt Manger)进行连接和适配。

这样聊可能比较抽象,我们可以拿官方给的一个例子来进行说明:

feb5352a-cf69-11ed-bfe3-dac502259ad0.png

1、首先是用户:输入一张黄色的向日葵图片,并且要求ChatGPT根据该图像预测深度来生成一朵红花,然后再一步一步将其做成卡通画。

2、接着是交互管理模块(Prompt Manger)发挥作用,在它的协调和控制下,VFM模块开始发挥作用:

首先需要运用深度估计模型来预测并生成图像的深度信息

然后需要运用深度图像模型来生成对应空间深度的红花图像;

最后运用Stable Diffusion的风格迁移模型来完成图像风格的变换。

3、最后Visual ChatGPT系统再将最终结果返回给用户,完成本次对话。

说到这里,有兴趣的小伙伴可以可以看看微软给出的一篇有关Visual ChatGPT的论文:https://arxiv.org/pdf/2303.04671.pdf

fed2f54c-cf69-11ed-bfe3-dac502259ad0.png

https://arxiv.org/pdf/2303.04671.pdf

里面关于这部分的流程解释得非常详细,而且还给出了多轮对话的案例、以及实验结果,有兴趣的小伙伴可以看看。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    3398

    浏览量

    42671
  • 视觉
    +关注

    关注

    1

    文章

    147

    浏览量

    24002
  • ChatGPT
    +关注

    关注

    29

    文章

    1566

    浏览量

    7999

原文标题:一个令人惊艳的ChatGPT项目,开源了!

文章出处:【微信号:CodeSheep,微信公众号:CodeSheep】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    ElfBoard开源项目|智能消防车项目

    项目——利用ELF 1开发板打造的智慧消防车。该项目展现物联网、数据处理等前沿技术在消防领域的应用潜力,下面就和各位小伙伴展示下这个开源
    的头像 发表于 01-04 16:43 304次阅读
    ElfBoard<b class='flag-5'>开源</b><b class='flag-5'>项目</b>|智能消防车<b class='flag-5'>项目</b>

    开放原子开源基金会与三开源项目举行捐赠签约仪式

    近日,在2024开放原子开发者大会暨首届开源技术学术大会开幕式上,开放原子开源基金会秘书长助理李博与openKylin、EasyAda、KWDB开源项目捐赠方代表共同签约。
    的头像 发表于 12-23 11:29 316次阅读

    凌蒙派OpenHarmony开源项目荣获本期Gitee官方推荐

    近日,我司凌蒙派OpenHarmony开源项目荣获本期Gitee官方推荐。本期Gitee官方推荐不仅是对凌蒙派OpenHarmony开源项目的高度认可,也是对我司在推动
    的头像 发表于 11-20 01:04 395次阅读
    凌蒙派OpenHarmony<b class='flag-5'>开源</b><b class='flag-5'>项目</b>荣获本期Gitee官方推荐

    SensiML开源Analytics Studio AutoML引擎

    我们很高兴地宣布,我们的AutoML服务器应用程序Analytics Studio将很快在开源许可下提供。我们还将推出新的开源项目网站,
    的头像 发表于 11-06 09:36 415次阅读
    SensiML<b class='flag-5'>开源</b><b class='flag-5'>了</b>Analytics Studio AutoML引擎

    怎样搭建基于 ChatGPT 的聊天系统

    理解ChatGPT和API ChatGPT是由OpenAI开发的种先进的自然语言处理模型,它能够理解和生成自然语言文本。要使用ChatGPT,你需要访问其API。OpenAI提供
    的头像 发表于 10-25 16:23 582次阅读

    真格基金宣布捐赠开源AI项目vLLM

    通用人工智能项目,Hugging Face 上有超过 40 万模型。每周,有超过 100 万行代码在开源 AI 领域中创建,开发者
    的头像 发表于 09-24 16:13 431次阅读

    OpenAI称ChatGPT周活跃用户突破2亿

    OpenAI近日宣布令人瞩目的成就:其明星产品ChatGPT的周活跃用户量已突破2亿大关,仅用年时间便实现
    的头像 发表于 09-02 16:29 617次阅读

    用launch pad烧录chatgpt_demo项目会有api key报错的原因?

    我用launch pad烧录chatgpt_demo项目问题会有api key报错;请问用launch pad要如何设置api key和调试?还是只能通过idf?
    发表于 06-27 07:59

    OpenAI 深夜抛出王炸 “ChatGPT- 4o”, “她” 来了

    当地时间5月13日OpenAI推出ChatGPT-4o,代表人工智能向前迈出的大步。在GPT-4turbo的强大基础上,这种迭代拥有显著的改进。在发布会的演示中,OpenAI展示该模型的高级
    发表于 05-27 15:43

    OpenAI正在为ChatGPT开发全新的搜索功能

    OpenAI近日传来令人振奋的消息,其正在为旗下明星产品ChatGPT研发项全新的搜索功能。据悉,这项功能将极大地拓宽ChatGPT的应用范围,并为用户带来更为全面、准确的回答。
    的头像 发表于 05-10 11:18 571次阅读

    未来的智慧园区,充满令人惊艳的场景

    未来的智慧园区,充满了令人惊艳的场景。它将实现从能源管理到环境监测的多重使命,用科技的力量为人类打造宜居、绿色的工作生活空间。 首先,智慧园区的能源管理将进入全新阶段。通过智能化的能源管理系统,实时
    的头像 发表于 05-08 15:33 329次阅读

    【Longan Pi 3H 开发板试用连载体验】给ChatGPT装上眼睛,还可以语音对话

    感谢发烧友论坛和Sipeed举办的本次活动,让我有机会可以体验到Longan Pi 3H这块超迷你的H618开发板。我打算用这块板子作为服务器,实现可以对话交互并且具备可视能力的ChatGPT
    发表于 04-12 12:41

    3月全志芯片开源项目分享合集

    基本的Linux派和语音扩展模板组成,非常简单。语音扩展模块提供基本的麦克风输入和功放,同时提供锂电池充放电系统,达到便携的目的,
    发表于 04-01 11:21

    在FPGA设计中是否可以应用ChatGPT生成想要的程序呢

    当下AI人工智能崛起,很多开发领域都可看到ChatGPT的身影,FPGA设计中,是否也可以用ChatGPT辅助设计呢?
    发表于 03-28 23:41

    【国产FPGA+OMAPL138开发板体验】(原创)6.FPGA连接ChatGPT 4

    嗨,亲爱的工程师、学生和爱好者们,我来啦!欢迎来到神秘的星嵌世界!如果你是位FPGA工程师或者对嵌入式异构技术感兴趣,那么你来到的地方绝对没错!今天,我们将起探索
    发表于 02-14 21:58