位置: IT常识 - 正文

老师,不干了,被偷家了,SAM分割任何事物模型,0样本分割了我研究一个月的数据(老师不干了可以从事什么行业)

编辑:rootadmin
原力计划老师,不干了,被偷家了,SAM分割任何事物模型,0样本分割了我研究一个月的数据

推荐整理分享老师,不干了,被偷家了,SAM分割任何事物模型,0样本分割了我研究一个月的数据(老师不干了可以从事什么行业),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:老师不干了作为家长怎么说,老师不干了还能干什么工作,老师不干了可以从事什么行业,老师不干了作为家长怎么说,老师不干了怎么在群里说,老师不干了怎么和老师告别,老师不干了怎么说,老师不干了怎么说,内容如对您有帮助,希望把文章链接给更多的朋友!

文章目录1. 简明扼要2. 分割效果3. 开始探索Segment Anything Model的核心愿景Segment Anything Model已经实现的功能1.交互式分割2.全自动分割Segment Anything Model官网Segment Anything Model数据集Segment Anything Model提示性分割4.文章 5.未来可能1. 简明扼要

SAM(Segmentation Anything Model)废话少说,出色要点有:

⭐ 建立了迄今为止最大的分割数据集:Segment Anything 1-Billion(SA-1B),1100万张图像,超过10亿个掩码(比任何现有的分割数据集多400倍) ⭐ 和chatgpt的启发思想一样,模型可提示prompt ⭐ 建立了通用的,全自动的分割模型,零样本灵活转化新任务,新领域,结果甚至优于之前的监督结果

2. 分割效果

是!不!是!很!哇!塞!

3. 开始探索

如果整个能量都是激动热闹的,就没有能量被留下来进入思考----我们来开始冷静探索⬇️

Segment Anything Model的核心愿景

减少对于特定任务的专业建模知识要求,减少训练计算需求,减少自己标注掩码的需求.也就是我不咋会,不咋标,不咋训(很环保♻️哈)就把目标分出来

Segment Anything Model已经实现的功能老师,不干了,被偷家了,SAM分割任何事物模型,0样本分割了我研究一个月的数据(老师不干了可以从事什么行业)

⭐ SAM已经学会了物体的概念 ⭐ 可以为图像或视频中的物体生成掩码,甚至是没遇见过的 ⭐ 通用性很强,无论是水下照片还是细胞显微镜

通过官方给的demo,可以测试自己的图像,分为交互式分割和全自动分割0成本很方便,例如开头的微信图片,鼠标点击4️⃣次,就提取到了肿瘤区域❗

1.交互式分割

1️⃣登录,accept条款 2️⃣自定义图像分割点击Upload an image 3️⃣直接在图像上点击想要分割的区域,会出现蓝色小点,代表前景,随着蓝色小点增多,分割的蓝色边缘越小越接近想分割的区域。 4️⃣也可以选择左侧remove area之后继续在图像上点击,会出现粉色小点(我爱粉色),代表背景,用来收缩图像边缘,结合蓝色和粉色小点,图像边缘进行加减法会接近目标区域。 5️⃣差不多之后点Cut out object,就小功告成啦!

2.全自动分割

1️⃣登录,accept条款 2️⃣自定义图像分割点击Upload an image 3️⃣点击Everything 就完事啦 他先生成采样点,之后全自动分割,不需要任何点击啦 效果 可以看到房顶很多形状,一个是正方形,另一个也是😅。但是,但是,但是!有的被分割了,有的没有,真的太好了!模型还有进步的空间(我还有努力的时间😅) 在这里小小的插一嘴,AI取代人的问题,随着社会前进,必将更新,我在浪潮里面,没在浪潮之巅,我能做的仅仅是随机摸索方向,希望顺流而上,这种未知,使人兴奋。自古逢秋悲寂寥,我言秋日胜春朝。脱下孔乙己的长衫的前提是,先穿上。

Segment Anything Model官网

网站地址

官方介绍SAM: 1️⃣ SAM允许用户只需点击一下就可以分割对象,或者通过交互式点击点来包括和排除对象。模型也可以用一个边界框来提示。 2️⃣ 当面临被分割的物体不明确时,SAM可以输出多个有效的掩码,这是解决现实世界中分割问题的重要和必要能力。 3️⃣SAM可以自动找到并屏蔽图像中的所有物体。 4️⃣SAM可以在预先计算图像嵌入后实时生成任何提示的分割掩码,允许与模型进行实时交互。

Segment Anything Model数据集

SAM使用数据集进行训练,标注着使用SAM交互式注释图像,反过来更新SAM。属实是闭环成长了。 有了SAM,收集新的分割掩码比以前更快 使用这种方法,通过模型辅助注释者,半自动半注释,模型全自动分割掩码这三个等级,造就了SAM数据集SA-1B达到1100万张图像,超过10亿个有效的高质量掩码, 比现有的分割数据集多400多倍,比COCO完全手动基于多边形的掩码注释快6.5倍。 SA-1B数据集不仅能获取的更快 更多 更方便,也 更平均,来自不同国家地区🌏 不同收入🎫 分析模型在人们感知的性别表现、感知的肤色和感知的年龄范围方面的潜在偏差,发现SAM在不同群体中的表现相似

Segment Anything Model提示性分割

受到nlp领域的prompt思想,对新的数据集和任务进行零次和少数次学习,SAM可以使用前景/背景点、一个粗糙的盒子或掩码、自由形式的文本,或者,一般来说,任何指示图像中分割内容的信息,都可以当做SAM的prompt

过程:1.图像编码器为图像产生一个一次性嵌入向量 2.轻量级编码器将prompt实时转换为嵌入向量3.结合之后送入轻量级解码器中得到掩码

4.文章

下载地址

5.未来可能

因为他是启发式模型,可以和用户互动

在AR/VR领域,SAM可以根据用户的目光来选择一个物体,将其提升到3D空间在创作领域,提取图像区域进行拼贴或视频编辑在研究领域,通过定位动物或物体来研究和跟踪视频
本文链接地址:https://www.jiuchutong.com/zhishi/299134.html 转载请保留说明!

上一篇:目标检测DiffusionDet: Diffusion Model for Object Detection(目标检测选SSD还是YOLO)

下一篇:学习笔记:点云库PCL(Point Cloud Library )介绍(点云入门)

  • 小米cc9和小米9se对比(小米cc9和小米cc9美图定制版手机壳通用吗)

    小米cc9和小米9se对比(小米cc9和小米cc9美图定制版手机壳通用吗)

  • 抖音买播放量对账号有影响吗(抖音买播放量有意义吗)

    抖音买播放量对账号有影响吗(抖音买播放量有意义吗)

  • 抖音授权管理是什么意思(抖音授权管理是空的怎么添加)

    抖音授权管理是什么意思(抖音授权管理是空的怎么添加)

  • 关闭启动项命令(电脑关闭启动项命令)

    关闭启动项命令(电脑关闭启动项命令)

  • 手机网络异常怎么修复(手机网络异常怎么解决方法视频)

    手机网络异常怎么修复(手机网络异常怎么解决方法视频)

  • 微信红包封面怎么设置(微信红包封面怎么免费领取)

    微信红包封面怎么设置(微信红包封面怎么免费领取)

  • 8p和8的区别在哪里(8p跟8)

    8p和8的区别在哪里(8p跟8)

  • 键盘另起一行是哪个键(键盘打字另起一行)

    键盘另起一行是哪个键(键盘打字另起一行)

  • t-ui无响应怎么解决(tmclient无响应)

    t-ui无响应怎么解决(tmclient无响应)

  • 微信群退群别人看得到吗(微信群退群别人知道吗)

    微信群退群别人看得到吗(微信群退群别人知道吗)

  • 华为手机扫码黑屏怎么回事(华为手机扫码黑屏)

    华为手机扫码黑屏怎么回事(华为手机扫码黑屏)

  • 天猫精灵不联网闹钟会不会响(天猫精灵不联网闹钟会响吗)

    天猫精灵不联网闹钟会不会响(天猫精灵不联网闹钟会响吗)

  • soul mate点亮要多久(soulmate点亮要多少心)

    soul mate点亮要多久(soulmate点亮要多少心)

  • 探探可以把位置关掉吗(探探把位置关掉后别人还呢看到嘛)

    探探可以把位置关掉吗(探探把位置关掉后别人还呢看到嘛)

  • 苹果x的耳机孔在哪(苹果x耳机孔图片)

    苹果x的耳机孔在哪(苹果x耳机孔图片)

  • 苹果x有面容和无面容的区别(苹果x有面容和无面容的差价)

    苹果x有面容和无面容的区别(苹果x有面容和无面容的差价)

  • 手机陌生人打不进电话怎么设置(手机陌生人打不进电话怎么解除)

    手机陌生人打不进电话怎么设置(手机陌生人打不进电话怎么解除)

  • 苹果8支持nfc吗(苹果8手机支持nfc吗)

    苹果8支持nfc吗(苹果8手机支持nfc吗)

  • pr怎样加字幕快捷(pr怎样加字幕快速出声音)

    pr怎样加字幕快捷(pr怎样加字幕快速出声音)

  • 备份后的文件在哪里找到(备份的文件在哪里)

    备份后的文件在哪里找到(备份的文件在哪里)

  • defaultuser0是什么(defaultusee0)

    defaultuser0是什么(defaultusee0)

  • iqoo是双卡双待吗(iqoo双卡双待如何关闭一个卡的移动网络)

    iqoo是双卡双待吗(iqoo双卡双待如何关闭一个卡的移动网络)

  • vue中的map()快速使用(vue-mapvgl)

    vue中的map()快速使用(vue-mapvgl)

  • 学习笔记:深度学习(2)——BP神经网络

    学习笔记:深度学习(2)——BP神经网络

  • 美国人容易用错的英语短语(上)(美国人用什么英语词典)

    美国人容易用错的英语短语(上)(美国人用什么英语词典)

  • 营业现金比率是用经营活动净流入还是经营活动流入
  • 出口退税新政策报关费发票要怎么开
  • 金税盘证书密码被锁死
  • 开具增值税发票未报送是什么意思?
  • 股东分红的账务处理结转
  • 工程劳务费计入哪个会计科目
  • 怎么快速金蝶数据入库
  • 建安企业核定征收税率多少
  • 利用废旧物资生产设备
  • 产品报废怎么做账
  • 接收商业承兑汇票需要到银行办手术吗
  • 企业取得5%的房产增值税发票是否可以抵扣呢?
  • 会计学中管理费用属于什么
  • 收到一笔误缴的税款
  • 无偿赠送材料的会计处理
  • 总公司购固定资产分摊每家店面怎么来做账
  • 开具增值税专用发票怎么开
  • 甲供材简易征收税率
  • 吊装费用税率
  • 标准误和标准差的区别和联系
  • 文化事业税收优惠政策
  • 出口报关和不报关的区别
  • boss直聘收费怎么这么贵
  • 跨省增值税专用发票可以抵扣吗
  • 去年的发票可以红冲重新开具吗?
  • 待清算专户
  • 关闭windows安全中心拦截
  • 驾校收入与成本的关系
  • 外籍人员个人所得税计算
  • 货到付款怎么做账
  • 零售企业进货退税政策
  • vue ref获取元素高度
  • 纳税申报表填写说明
  • 公司变更需要哪些资料~问华杰 财务
  • 文本生成图像前景怎么样
  • php教程从入门到精通
  • 人力资源公司如何找客户
  • 退回材料的会计分录
  • 单位应缴住房公积金
  • 一般纳税人购进免税农产品如何抵扣进项税额
  • 金蝶软件资产负债表怎么生成
  • 经营现金支出包含哪些内容
  • 比赛奖金怎么做账
  • 研发支出属于什么类
  • 开票资料需要哪些东西
  • 零申报对企业有什么影响
  • 企业清算所得税申报
  • 应付职工薪酬和生产成本的区别
  • 出口退税进项发票会计分录
  • 现金支付的范围包括
  • 暂估成本估多了怎么办
  • 买断式买入
  • mysql怎么把列变成行
  • 任务栏都不见了
  • win10升级win1
  • Linux服务器管理的开机界面
  • 双系统mac如何从mac系统启动
  • 磁盘限制
  • windows8宽带连接设置
  • win7桌面快捷方式图标没箭头
  • kernel headers not found for target kernel
  • cocos2dx lua android glsurfaceview 截图
  • es6新增的数据结构
  • javascript怎么用
  • linux那么多命令怎么记
  • 仿客齐集首页导航条DIV+CSS+JS [代码实例]
  • 深入理解关于教育两个大计
  • shell 四则运算
  • 输出中断
  • powercli命令
  • 初步使用筷子而动作不规范的幼儿保育员应该
  • JavaScript正则表达
  • python解析函数
  • unity3d脚本怎么用
  • 使用jquery实现的项目
  • java web开发流程
  • python编程简单案例
  • 电子税务局如何申报社保
  • 地方税务局投诉有用吗
  • 税务ukey版商品编码怎么添加
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设