位置: IT常识 - 正文

一个令人惊艳的ChatGPT项目,开源了!(一个惊艳了)

编辑:rootadmin
一个令人惊艳的ChatGPT项目,开源了!

推荐整理分享一个令人惊艳的ChatGPT项目,开源了!(一个惊艳了),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:令人惊艳的人,让人惊艳的人,一个令人惊艳的故事,一个惊艳了,一个令人惊艳的空间,一个令人惊艳的人,一个令人惊艳的空间,一个令人惊艳的时刻作文,内容如对您有帮助,希望把文章链接给更多的朋友!

最近在GitHub上发现了一个爆火的开源项目。

好家伙,凑近一看,居然还是由微软开源,并且和最近炙手可热的ChatGPT息息相关。

项目的名字叫做:Visual ChatGPT。

https://github.com/microsoft/visual-chatgpt

这个项目最早是3月上旬微软开源的,项目宣布开源后仅用了短短一周,就斩获了2w+ star。

到现在为止,距离当初项目开源大约过去了3周多,仓库star数则来到了28k+,亦可谓是火箭式上涨(doge)。

众所周知,ChatGPT自2022年11月推出以来,持续走红。

ChatGPT具备强大的会话能力,可以理解文字、聊天、写小说、解答问题、编写代码… 但是目前还并不能直接处理或生成图像。

而Visual ChatGPT这个项目则可以把ChatGPT和一系列视觉基础模型(VFM,Visual Foundation Model)给联系起来,以便实现在ChatGPT聊天的过程中来发送和接收图像,也使得ChatGPT能够处理更为复杂的视觉任务。

一个令人惊艳的ChatGPT项目,开源了!(一个惊艳了)

讲白了,就是通过Visual ChatGPT,可以把一系列视觉基础模型给接入ChatGPT,使得ChatGPT能胜任更为复杂的视觉处理任务。

Visual ChatGPT的整体技术架构图如上所示,我们可以清楚地看到ChatGPT和视觉基础模型(VFM,Visual Foundation Model)分别位于其中的位置。

一方面,ChatGPT(或LLM)作为一个通用接口,继续发挥它本身的优势,提供对不同话题的智能理解。另一方面,基础视觉模型VFM则通过提供特定领域的深入知识来充当领域专家,它们通过交互管理模块(Prompt Manger)进行连接和适配。

这样聊可能比较抽象,我们可以拿官方给的一个例子来进行说明:

1、首先是用户:输入一张黄色的向日葵图片,并且要求ChatGPT根据该图像预测深度来生成一朵红花,然后再一步一步将其做成卡通画。

2、接着是交互管理模块(Prompt Manger)发挥作用,在它的协调和控制下,VFM模块开始发挥作用:

首先需要运用深度估计模型来预测并生成图像的深度信息;然后需要运用深度图像模型来生成对应空间深度的红花图像;最后运用Stable Diffusion的风格迁移模型来完成图像风格的变换。

3、最后Visual ChatGPT系统再将最终结果返回给用户,完成本次对话。

说到这里,有兴趣的小伙伴可以可以看看微软给出的一篇有关Visual ChatGPT的论文。

里面关于这部分的流程解释得非常详细,而且还给出了多轮对话的案例、以及实验结果,有兴趣的小伙伴可以看看。

好了,今天的分享就到这里了,感谢大家的收看,我们下篇见。

注:本文在GitHub开源仓库「编程之路」 https://github.com/rd2coding/Road2Coding 中已经收录,里面有我整理的6大编程方向(岗位)的自学路线+知识点大梳理、面试考点、我的简历、几本硬核pdf笔记,以及程序员生活和感悟,欢迎star。

本文链接地址:https://www.jiuchutong.com/zhishi/300243.html 转载请保留说明!

上一篇:1000套web前端期末大作业 HTML+CSS+JavaScript网页设计实例 企业网站制作【建议收藏】(web前端视频教程全套)

下一篇:关于uniapp和Vue的生命周期(uniapp和mpvue比较)

  • 支付宝我的家怎么踢人呢(支付宝我的家怎么存钱)

    支付宝我的家怎么踢人呢(支付宝我的家怎么存钱)

  • 体温计mode是什么意思(体温计mode是什么按键图片)

    体温计mode是什么意思(体温计mode是什么按键图片)

  • mate30发热严重怎么办(mate30 发热)

    mate30发热严重怎么办(mate30 发热)

  • 会员plus版是什么区别(plus 会员)

    会员plus版是什么区别(plus 会员)

  • 小米称出现L是什么情况(小米称出现l是怎么回事)

    小米称出现L是什么情况(小米称出现l是怎么回事)

  • 什么是网络空间(什么是网络空间道德建设的基础)

    什么是网络空间(什么是网络空间道德建设的基础)

  • 国内主叫通话什么意思(国内主叫和国内通话的区别)

    国内主叫通话什么意思(国内主叫和国内通话的区别)

  • 华为nova5z屏幕材质(华为nova5屏幕材质)

    华为nova5z屏幕材质(华为nova5屏幕材质)

  • 抖音不想看的视频怎么屏蔽(抖音不想看的视频怎么不感兴趣)

    抖音不想看的视频怎么屏蔽(抖音不想看的视频怎么不感兴趣)

  • 荣耀v30指纹解锁在哪里(荣耀v30指纹解锁在哪里设置)

    荣耀v30指纹解锁在哪里(荣耀v30指纹解锁在哪里设置)

  • 微信图片过期怎么恢复(微信图片过期怎么恢复原图免费)

    微信图片过期怎么恢复(微信图片过期怎么恢复原图免费)

  • ps如何加上logo(ps如何加上双眼皮)

    ps如何加上logo(ps如何加上双眼皮)

  • 一个身份证能绑定几个陌陌号(一个身份证能绑两个抖音吗)

    一个身份证能绑定几个陌陌号(一个身份证能绑两个抖音吗)

  • 一加搬家为什么用不了(一加搬家为什么这么慢)

    一加搬家为什么用不了(一加搬家为什么这么慢)

  • md102是哪年的生产的(md103i7是哪一年)

    md102是哪年的生产的(md103i7是哪一年)

  • 三星怎么看电池损耗(三星怎么看电池循环次数)

    三星怎么看电池损耗(三星怎么看电池循环次数)

  • 电脑打印页面设置在哪(电脑打印页面设置怎么固定)

    电脑打印页面设置在哪(电脑打印页面设置怎么固定)

  • 华为电子保修卡在哪找(华为电子保修卡在哪里查询)

    华为电子保修卡在哪找(华为电子保修卡在哪里查询)

  • 抖音怎么让原音变声(抖音怎么原音加自己的声音)

    抖音怎么让原音变声(抖音怎么原音加自己的声音)

  • 小米手机分身密码怎么改(小米手机分身密码忘了)

    小米手机分身密码怎么改(小米手机分身密码忘了)

  • final cut pro怎么导出(final cut pro怎么保存)

    final cut pro怎么导出(final cut pro怎么保存)

  • 母婴app开发误区有哪些(母婴app开发误区是什么)

    母婴app开发误区有哪些(母婴app开发误区是什么)

  • 建兰的养殖方法(图文)(建兰的养殖方法和注意事项 盆栽)

    建兰的养殖方法(图文)(建兰的养殖方法和注意事项 盆栽)

  • 4个生活小常识,让你更懂生活(4个生活小常识简短)

    4个生活小常识,让你更懂生活(4个生活小常识简短)

  • 总额法和净额法会计分录对比
  • 广告行业的税负率
  • 什么是小规模纳税人税率
  • 出口退税哪些资料要留底
  • 增量留抵退税会计处理
  • 非流动资产处置损失包括哪些
  • 固定资产特性
  • 多借多贷的会计分录格式
  • 税前利润总额的计算公式
  • 用现金支付购买增值税应税服务
  • 处理报废的固定资产
  • 印花税金额不足多少可以不收
  • 增值税专用发票电子版
  • 普通发票跨年作废有影响吗
  • 工业企业税负率一般控制在多少?
  • 转出未交增值税怎么算
  • 经济社会中民商是什么
  • 资产负债率之比
  • 制造业领用材料规章制度的好处
  • 租用服务器会泄漏数据吗
  • 银行收取年费是什么意思
  • 购买法下购买成本包括
  • 全年物业费需要待摊吗
  • 一般纳税人附加税费减免政策
  • 小规模库存商品结转成本太低怎么办
  • 企业收到应收账款6要素哪个增加哪个减少
  • 应交税费核算
  • 公司免税是指免的什么税
  • 公司收到拆迁补偿款要交税吗
  • ms-dos 6.0
  • php开发的优点与不足
  • 在win7中,如何创建一个TXT文件
  • rtos有什么用
  • 冲回上年多提的费用会计分录
  • 事业单位接受捐赠固定资产入账
  • 提供应税服务的纳税义务发生时间
  • php完整教程
  • 生产加工型企业安全隐患排查内容
  • 投资收益属于营业成本吗
  • pytorch torch
  • php图片代码
  • 出口退税税率差
  • 如何区分误餐费和补助费
  • python 定制类
  • 申报个税的流程怎么操作
  • 企业将重组债务转为资本的会计处理
  • sql查询必须在什么的基础上创建
  • 银行对账单和存款日记账怎样核对并标识
  • 汇兑损益计入
  • 职工薪酬纳税调整
  • 税务局手续费返还什么时间到账
  • 以旧换新会计科目
  • 样品制作公司
  • 企业内部银行转账怎么记账
  • 数据库alter change
  • 查找星期几
  • 新百伦588
  • xp系统文件损坏怎么修复
  • windowsaudio服务不存在或已删除
  • hdaudpropshortcut.exe是什么进程 作用是什么 hdaudpropshortcut进程查询
  • unix网络命令
  • win8系统怎么设置无线网连接啊
  • quick-cocos2d-x如何在mac下编译安卓版本
  • cocos 源码
  • 在bootstrap中,有哪几种导航
  • 随机色彩
  • python模拟登录爬取数据
  • js实现apply函数
  • express的中间件
  • iframe的使用和例子
  • jquery ul li
  • android studio怎么样
  • unity image fillamount
  • 源码讲解
  • python写邮箱
  • 出口退税期限最长几个月以上
  • 深圳国委
  • 天津普通发票查询平台
  • 房子契税发票没给怎么办
  • 2010年末实现净利润390万,宣告发放现金股利40万,在计算本年未分配利润时,是否要减掉这40万?
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设