位置: IT常识 - 正文

Segment Anything Model (SAM)——卷起来了,那个号称分割一切的CV大模型他来了(segment anything model模型 需要的配置)

编辑:rootadmin
Segment Anything Model (SAM)——卷起来了,那个号称分割一切的CV大模型他来了

推荐整理分享Segment Anything Model (SAM)——卷起来了,那个号称分割一切的CV大模型他来了(segment anything model模型 需要的配置),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:segment anything model模型 需要的配置,segment anything model,segment anything model最新版本,segment anything model模型 需要的配置,segment anything model官网,segment anything model github,segment anything model,segment anything model配置,内容如对您有帮助,希望把文章链接给更多的朋友!

最近每天打开微信看到10个公众号里面差不多有11个都在各种玩赚chatGPT,每个都在说是各种大好风口,哎,看得眼睛都是累的。

今天下午无意间看到Meta发布了一款号称能分割一切的CV大模型,CV圈也开始卷起来,今年各种大模型要爆发了感觉。

吃瓜群众满怀好奇,点开了解一下。

官方论文在这里,感兴趣可以自行阅读。

 官方同时也开源了项目,地址在这里,如下所示:

 可以看到:才开源了一天的时间就已经有6k的star量了,后续增长感觉会更猛的!

官方也给出来了数据集地址,在这里,如下所示:

 有需要的话可以自行下载使用即可。

当然了这么精彩的技术自然不会少的了技术博客的介绍,官方的技术博客在这里。

为了能让大家第一时间上手体验,这里官方也是开放出来了Demo地址,在这里,如下所示:

 上传一张我本地的图片,用的就是上一篇博客摔倒检测的数据集,如下:

 我添加了一个box,瞬间就给我分割出来了,如下:

 随着光标的移动,模型给出来的响应也是很快的:

 甚至还可以一键cutout所有的子对象如下:

 很强大了已经。

官方这里也提供了很多实例图片,简单看下:

 选择小狗试试吧:

Segment Anything Model (SAM)——卷起来了,那个号称分割一切的CV大模型他来了(segment anything model模型 需要的配置)

添加box对指定区域直接分割:

 再来一张:

 效果如下:

 指定区域分割:

 最后再来试一下:

 效果如下:

 感兴趣的话都可以自己玩玩体验一下。

当然了如果想要自己安装使用也是可以的,官方同样给了安装说明如下:

先安装一些基础依赖pip install opencv-python pycocotools matplotlib onnxruntime onnx安装SAM方法一:pip install git+https://github.com/facebookresearch/segment-anything.git方法二:git clone git@github.com:facebookresearch/segment-anything.gitcd segment-anything; pip install -e .

 模型库在这里,需要的自行下载即可。

使用方法也很简单如下:

#from a given prompt:from segment_anything import build_sam, SamPredictor predictor = SamPredictor(build_sam(checkpoint="</path/to/model.pth>"))predictor.set_image(<your_image>)masks, _, _ = predictor.predict(<input_prompts>)

或者也可以如下使用:

#generate masks for an entire image:from segment_anything import build_sam, SamAutomaticMaskGeneratormask_generator = SamAutomaticMaskGenerator(build_sam(checkpoint="</path/to/model.pth>"))masks = mask_generator_generate(<your_image>)

当然了,mask也可以通过命令行生成,如下:

python scripts/amg.py --checkpoint <path/to/sam/checkpoint> --input <image_or_folder> --output <output_directory>

关于两种不同的调用计算方式,官方也都给出来了详细的demo样例如下:

predictor_example

automatic_mask_generator_example

想要导出onnx格式的话也是可以的,如下:

python scripts/export_onnx_model.py --checkpoint <path/to/checkpoint> --output <path/to/output>

这里一共提供了H、L、B三种不同size的模型,如下:

ViT-H SAM modelViT-L SAM modelViT-B SAM model

 三种不同模型体积如下:

 可以根据自己的兴趣自由使用即可。

今天就简单到这里了,后面找时间在仔细看看吧!

本文链接地址:https://www.jiuchutong.com/zhishi/297675.html 转载请保留说明!

上一篇:pytorch 笔记:torch.distributions 概率分布相关(更新中)(pytorch torch)

下一篇:vue3 父子组件传参详解(vue3父子组件传递数组通信)

  • 酷狗音乐歌词状态栏怎么关闭(酷狗的歌词)

    酷狗音乐歌词状态栏怎么关闭(酷狗的歌词)

  • 苹果6sp屏幕尺寸多大(苹果6sp屏幕尺寸多长)

    苹果6sp屏幕尺寸多大(苹果6sp屏幕尺寸多长)

  • 闲聊提现一直进行中怎么办(闲聊提现一直进不了)

    闲聊提现一直进行中怎么办(闲聊提现一直进不了)

  • 微信小程序怎么删除拼多多(微信小程序怎么全部删除)

    微信小程序怎么删除拼多多(微信小程序怎么全部删除)

  • 拍抖音用什么软件制作视频(拍抖音用什么软件拍摄是最好的)

    拍抖音用什么软件制作视频(拍抖音用什么软件拍摄是最好的)

  • 手机号注册id安全吗(手机号注册ID安全吗)

    手机号注册id安全吗(手机号注册ID安全吗)

  • prtscn键在哪(prtscn键在哪怎么截图)

    prtscn键在哪(prtscn键在哪怎么截图)

  • 蜂窝数据栏的app不见了(app的蜂窝数据栏没有了)

    蜂窝数据栏的app不见了(app的蜂窝数据栏没有了)

  • 电脑箭头不见了怎么办(电脑箭头不见了没有鼠标怎么恢复)

    电脑箭头不见了怎么办(电脑箭头不见了没有鼠标怎么恢复)

  • 输入输出的寻址方式有哪几种(输入输出的编址方式)

    输入输出的寻址方式有哪几种(输入输出的编址方式)

  • 抖音蓝v认证几天可以通过(抖音蓝v认证几个账号)

    抖音蓝v认证几天可以通过(抖音蓝v认证几个账号)

  • 如何插入备注(添加备注怎么添加)

    如何插入备注(添加备注怎么添加)

  • 手机录屏什么意思(手机录屏功能是什么意思)

    手机录屏什么意思(手机录屏功能是什么意思)

  • iphone11自带什么配件(苹果11都是自带什么软件)

    iphone11自带什么配件(苹果11都是自带什么软件)

  • 手机进灰尘会怎么去除(手机进了灰尘怎么清理)

    手机进灰尘会怎么去除(手机进了灰尘怎么清理)

  • 如何宣传网站(如何宣传网站文章)

    如何宣传网站(如何宣传网站文章)

  • 打电话显示hd会收费吗(打电话显示hd会收费吗怎么关闭啊)

    打电话显示hd会收费吗(打电话显示hd会收费吗怎么关闭啊)

  • 华为p30pro能插耳机吗(华为p30pro插耳机)

    华为p30pro能插耳机吗(华为p30pro插耳机)

  • 电脑怎么下ps软件(电脑怎么下载ps的软件)

    电脑怎么下ps软件(电脑怎么下载ps的软件)

  • 键盘的上下左右不能用(键盘的上下左右怎么变成了asdw)

    键盘的上下左右不能用(键盘的上下左右怎么变成了asdw)

  • 微信共享实时位置可以修改吗(微信共享实时位置)

    微信共享实时位置可以修改吗(微信共享实时位置)

  • 金蝶新建帐套的步骤(金蝶新建帐套的密码)

    金蝶新建帐套的步骤(金蝶新建帐套的密码)

  • 鼠标滚轮上下没有反应(鼠标滚轮上下没有反应,只能左右)

    鼠标滚轮上下没有反应(鼠标滚轮上下没有反应,只能左右)

  • 滴水观音的养殖方法和注意事项(滴水观音的养殖方法选好浇水)

    滴水观音的养殖方法和注意事项(滴水观音的养殖方法选好浇水)

  • 谷歌Colab(免费算力平台)——正确打开方式(常用操作指导tips)(谷歌colab免费额度)

    谷歌Colab(免费算力平台)——正确打开方式(常用操作指导tips)(谷歌colab免费额度)

  • 塑料制品开票税率
  • 国税税务登记号查询
  • 企业转出多交增值税吗
  • 外币借款本金的汇兑差额
  • 企业所得税的成本是含税还是不含税
  • 小规模纳税人应交增值税怎么算
  • 银行存款日记账电子表格模板
  • 预提车间租入固定资产租金800元
  • 商贸企业产值含税吗
  • 关联公司往来款算应收账款吗
  • 增值税纳税申报表怎么填
  • 法人可以自己申诉个税吗
  • 建筑企业异地预交税款如何处理
  • 个人劳务所得税税率表最新2022
  • 商贸公司购进农产品可以抵扣吗
  • 专项土地补偿款怎么入账?
  • 月度资金计划明细表模板
  • 长期借款利息计入在建工程
  • 处理报废的固定资产
  • 出售固定资产支付的相关费用计入
  • 污水处理增值税征收品目
  • 如何查看windows10
  • mac上安装homebrew
  • 固定资产报废能报保险公司理赔吗
  • 公司决议效力确认纠纷
  • 在建工程的施工方案可以外传吗
  • macbook无限输入z
  • PHP 中dirname(_file_)讲解
  • win101709密钥
  • 查补以前年度税款账务处理
  • 安置残疾人就业单位城镇土地使用税
  • 私有化部署chatGPT,告别网络困扰
  • 收到多开发票的会计分录
  • 缴纳印花税需要带公章吗
  • dev怎么保存项目
  • 财务费用有发票吗
  • 发行公司债券发生的折价
  • sql server数据
  • 增值税进项税额转出的情况有哪些
  • 股权转让中土地要否缴纳增值税
  • 个体工商户生产经营所得税优惠政策
  • 转账给个人账户
  • 转回坏账准备影响营业利润吗
  • 小规模企业自开收购牛发票增值税怎样申报
  • 工程检测费的会计分录
  • 担保公司的担保费能退吗
  • 年底结账会计处理
  • 商品盘点库存的方法
  • sql面试题50题
  • 深入理解mysql主从原理32讲
  • ghost读取不到硬盘
  • ubuntu更新软件
  • win10快速访问在哪
  • centos常用命令安装
  • win10系统如何
  • Linux中通过Socket文件描述符寻找连接状态介绍
  • win7怎么提升电脑性能
  • fragment懒加载原理
  • [置顶] [寒江孤叶丶的Cocos2d-x之旅_29]在Cocos2d-x中集成protobuf (Protocol Buffers)
  • ajax请求数据放到页面
  • node文件目录
  • Android游戏开发读后感
  • androidannotations的background和UiThread配合使用参考
  • js实现组件功能
  • 有哪些小工具
  • core文件的作用
  • javascript入门经典
  • Node.js中的construct构造函数
  • Intermediate Unity 3D for iOS: Part 2/3
  • angularjs教程
  • numpy基础知识
  • javascript教程代码
  • 增值税一般纳税人和小规模纳税人的区别
  • 江西省税务局官网查询系统
  • 增值税进项发票如何做账
  • 深圳市国家税务局网站
  • 税务代办需要什么资料
  • 税务上门核查要看什么
  • 北京共有产权房房源信息
  • 江西省国家税务局李德平
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设