位置: IT常识 - 正文

Segment Anything Model (SAM)——卷起来了,那个号称分割一切的CV大模型他来了(segment anything model模型 需要的配置)

发布时间:2024-01-16
Segment Anything Model (SAM)——卷起来了,那个号称分割一切的CV大模型他来了

推荐整理分享Segment Anything Model (SAM)——卷起来了,那个号称分割一切的CV大模型他来了(segment anything model模型 需要的配置),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:segment anything model模型 需要的配置,segment anything model,segment anything model最新版本,segment anything model模型 需要的配置,segment anything model官网,segment anything model github,segment anything model,segment anything model配置,内容如对您有帮助,希望把文章链接给更多的朋友!

最近每天打开微信看到10个公众号里面差不多有11个都在各种玩赚chatGPT,每个都在说是各种大好风口,哎,看得眼睛都是累的。

今天下午无意间看到Meta发布了一款号称能分割一切的CV大模型,CV圈也开始卷起来,今年各种大模型要爆发了感觉。

吃瓜群众满怀好奇,点开了解一下。

官方论文在这里,感兴趣可以自行阅读。

 官方同时也开源了项目,地址在这里,如下所示:

 可以看到:才开源了一天的时间就已经有6k的star量了,后续增长感觉会更猛的!

官方也给出来了数据集地址,在这里,如下所示:

 有需要的话可以自行下载使用即可。

当然了这么精彩的技术自然不会少的了技术博客的介绍,官方的技术博客在这里。

为了能让大家第一时间上手体验,这里官方也是开放出来了Demo地址,在这里,如下所示:

 上传一张我本地的图片,用的就是上一篇博客摔倒检测的数据集,如下:

 我添加了一个box,瞬间就给我分割出来了,如下:

 随着光标的移动,模型给出来的响应也是很快的:

 甚至还可以一键cutout所有的子对象如下:

 很强大了已经。

官方这里也提供了很多实例图片,简单看下:

 选择小狗试试吧:

Segment Anything Model (SAM)——卷起来了,那个号称分割一切的CV大模型他来了(segment anything model模型 需要的配置)

添加box对指定区域直接分割:

 再来一张:

 效果如下:

 指定区域分割:

 最后再来试一下:

 效果如下:

 感兴趣的话都可以自己玩玩体验一下。

当然了如果想要自己安装使用也是可以的,官方同样给了安装说明如下:

先安装一些基础依赖pip install opencv-python pycocotools matplotlib onnxruntime onnx安装SAM方法一:pip install git+https://github.com/facebookresearch/segment-anything.git方法二:git clone git@github.com:facebookresearch/segment-anything.gitcd segment-anything; pip install -e .

 模型库在这里,需要的自行下载即可。

使用方法也很简单如下:

#from a given prompt:from segment_anything import build_sam, SamPredictor predictor = SamPredictor(build_sam(checkpoint="</path/to/model.pth>"))predictor.set_image(<your_image>)masks, _, _ = predictor.predict(<input_prompts>)

或者也可以如下使用:

#generate masks for an entire image:from segment_anything import build_sam, SamAutomaticMaskGeneratormask_generator = SamAutomaticMaskGenerator(build_sam(checkpoint="</path/to/model.pth>"))masks = mask_generator_generate(<your_image>)

当然了,mask也可以通过命令行生成,如下:

python scripts/amg.py --checkpoint <path/to/sam/checkpoint> --input <image_or_folder> --output <output_directory>

关于两种不同的调用计算方式,官方也都给出来了详细的demo样例如下:

predictor_example

automatic_mask_generator_example

想要导出onnx格式的话也是可以的,如下:

python scripts/export_onnx_model.py --checkpoint <path/to/checkpoint> --output <path/to/output>

这里一共提供了H、L、B三种不同size的模型,如下:

ViT-H SAM modelViT-L SAM modelViT-B SAM model

 三种不同模型体积如下:

 可以根据自己的兴趣自由使用即可。

今天就简单到这里了,后面找时间在仔细看看吧!

本文链接地址:https://www.jiuchutong.com/zhishi/297675.html 转载请保留说明!

上一篇:pytorch 笔记:torch.distributions 概率分布相关(更新中)(pytorch torch)

下一篇:vue3 父子组件传参详解(vue3父子组件传递数组通信)

  • 怎么隐藏微信置顶聊天(新版微信怎么隐藏置顶)

    怎么隐藏微信置顶聊天(新版微信怎么隐藏置顶)

  • 华为nova4是超级快充吗(华为nova4超级截屏怎么设置)

    华为nova4是超级快充吗(华为nova4超级截屏怎么设置)

  • word字体颜色快捷键(word字体颜色快捷键怎么设置)

    word字体颜色快捷键(word字体颜色快捷键怎么设置)

  • 手机界面变成黑色怎么办(手机界面变成黑色怎么调回来)

    手机界面变成黑色怎么办(手机界面变成黑色怎么调回来)

  • 为什么瞬间被soul隐藏起来了(为什么瞬间被souler隐藏起来了)

    为什么瞬间被soul隐藏起来了(为什么瞬间被souler隐藏起来了)

  • 微信红包怎么设置指纹支付(微信红包怎么设置别人看不到金额)

    微信红包怎么设置指纹支付(微信红包怎么设置别人看不到金额)

  • u盘歌曲车上无法播放(车载u盘插上没有歌)

    u盘歌曲车上无法播放(车载u盘插上没有歌)

  • 骁龙625相当于麒麟多少(骁龙625相当于麒麟710)

    骁龙625相当于麒麟多少(骁龙625相当于麒麟710)

  • 表格后面数字怎么都是0(表格后面数字怎样排序)

    表格后面数字怎么都是0(表格后面数字怎样排序)

  • 美团开店宝是干什么的(美团开店宝是啥)

    美团开店宝是干什么的(美团开店宝是啥)

  • 微信bug什么意思(微信bug什么意思啊)

    微信bug什么意思(微信bug什么意思啊)

  • 取消订单红包能返回吗(取消订单后红包会不会退回来?)

    取消订单红包能返回吗(取消订单后红包会不会退回来?)

  • 文字间隔怎么设置(怎样设置文字间隔)

    文字间隔怎么设置(怎样设置文字间隔)

  • 手机扫条码怎么扫(手机扫描商品条码)

    手机扫条码怎么扫(手机扫描商品条码)

  • wps表格里面怎么查找(Wps表格里面怎么加横线)

    wps表格里面怎么查找(Wps表格里面怎么加横线)

  • 美版苹果xsmax双卡怎么放(xsmax美版双卡双待吗?)

    美版苹果xsmax双卡怎么放(xsmax美版双卡双待吗?)

  • vivo手机手电筒打开不亮(vivo手机手电筒在哪里设置)

    vivo手机手电筒打开不亮(vivo手机手电筒在哪里设置)

  • vivo充电图标在哪调(vivos6充电图标)

    vivo充电图标在哪调(vivos6充电图标)

  • 小米手机屏幕旋转失灵(小米手机屏幕旋转怎么设置方法)

    小米手机屏幕旋转失灵(小米手机屏幕旋转怎么设置方法)

  • 手机时间竖着怎样改为横着(手机时间竖着怎么调整)

    手机时间竖着怎样改为横着(手机时间竖着怎么调整)

  • 充电宝怎么修(充电宝怎么修复容量)

    充电宝怎么修(充电宝怎么修复容量)

  • 手机反向充电怎么设置(手机反向充电怎么弄)

    手机反向充电怎么设置(手机反向充电怎么弄)

  • 如何在ppt中加入文件链接(如何在ppt中加入自定义按钮)

    如何在ppt中加入文件链接(如何在ppt中加入自定义按钮)

  • Mac Chrome打开HTTPS证书错误问题解决方法

    Mac Chrome打开HTTPS证书错误问题解决方法

  • legacy是什么意思啊详情(电脑legacy是什么意思)

    legacy是什么意思啊详情(电脑legacy是什么意思)

  • 塔霍湖国家公园中的沙港,内华达州 (© Mariusz Blach/Getty Images Plus)(天国拯救晕倒的人多久起来)

    塔霍湖国家公园中的沙港,内华达州 (© Mariusz Blach/Getty Images Plus)(天国拯救晕倒的人多久起来)

  • 一品红叶子特写 (© Charles Floyd/Alamy)(一品红叶发黄咋回事儿)

    一品红叶子特写 (© Charles Floyd/Alamy)(一品红叶发黄咋回事儿)

  • Seata 1.5.2 源码学习(seata1.3.0配置)

    Seata 1.5.2 源码学习(seata1.3.0配置)

  • 员工加班误餐费怎么做凭证
  • 劳务报酬收入是否含税
  • 全资收购企业需要交税吗
  • 飞机票退票费如何处理账务
  • 法人名下的车辆费用如何进公司帐
  • 企业投资可以税后扣除吗
  • 作废的增值税专用发票怎么处理
  • 收到实收资本要交什么税
  • 房地产活动礼品送什么比较吸引人
  • 工资中代扣水电费是什么意思
  • 外汇收支申报流程
  • 所得税汇算清缴时间期限
  • 哪些房产免纳房产税
  • 个人所得税费怎么计算2021
  • 个人劳务报酬所得税计算方法2020
  • 上级拨入资金计入什么科目
  • 以前年度的其他应付款不用付怎么处理
  • 在线上网测试
  • mac系统 硬盘
  • 软件和硬件的成本按销售占比做分摊怎么算
  • 更改win10通知
  • psdrvcheck.exe - psdrvcheck是什么进程 有什么用
  • 苹果电脑出现macos什么意思
  • 担保公司的会计分录
  • 已提折旧固定资产评估增值的会计处理是企业会计准则
  • php根据日期判断星座
  • win7纯净版系统安装教程
  • 摊余成本计量的金融资产若溢价购买小于
  • Wat Chaloem Phra Kiat Phrachomklao Rachanusorn的浮庙,泰国南邦 (© pa_YON/Getty Images)
  • uniapp使用px还是rpx
  • 挂在树上的小鸟怎么画
  • antd:ConfigProvider+getPopupContainer解决筛选框遮挡问题(及其他浮层问题)
  • ChatGPT火爆来袭,携手参与为开源助力
  • css选择器怎么用
  • 小规模公司卖车怎么开票
  • 物流货运发票要交税吗
  • 发票税额打印不全可以入账吗
  • js读取json配置文件
  • opengl全称
  • 不借助的英文
  • 收到员工交来现金怎么入账
  • 股东投钱一般怎么投
  • 银行会计的基本核算方法包括的内容有
  • 公账取现用途写什么
  • 利润分配转作股本的股利属于什么科目
  • sql server 2008中的权限分为三类
  • 企业出租专利技术收取的租金不得确认为收入对吗
  • 收到备用金会计分录
  • 固定制造费用需要逐项进行预计通常与本期产量无关
  • 转出未交增值税借方余额怎么处理
  • 应付账款数字太大咋办
  • 支付资金占用费的承诺函怎么写
  • 一家新成立的贸易企业
  • 投资款如何界定
  • 对存在标的资产的亏损合同,企业应首先对标的资产
  • 收到稳岗补贴要交税吗
  • 公转私钱最好的方法
  • 负债类科目分录
  • 外地预缴需要缴纳印花税吗
  • 多少金额以上算固定资产
  • 备份数据还原不了怎么办
  • win8怎么看windows
  • centos7挂载
  • windows 自启动
  • win10系统更新后网速变慢
  • win7系统怎么查看隐藏文件夹
  • 触发器csdn
  • 对用药方案做合理性评估时
  • shell中管道的作用
  • unity ui坐标
  • sequelize-cli
  • 批处理转义字符如何
  • 浅蓝色html代码
  • javascript例题
  • 置顶是什么意思呢
  • jquery键盘事件及keycode大全
  • 税务局约谈记录
  • 土地重置成本价
  • 山东增值税普通发票查询
  • 哈尔滨地税局电话
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号