位置: IT常识 - 正文

图像识别算法汇总(图像识别算法汇总表)

编辑:rootadmin
图像识别算法汇总 图像识别算法汇总什么是图像识别?图像识别如何为人类工作?图像识别如何与机器一起工作?通过机器学习练习图像识别流程和模型设置、训练和测试机器学习图像识别支持矢量机(SVM)图像检索模型Viola-Jones算法卷积神经网络基于区域FasterRCNNSSDYOLO机器学习图像识别的不同应用领域面部识别健康与医学智慧农业安保和安全电子商务

推荐整理分享图像识别算法汇总(图像识别算法汇总表),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:图像识别算法汇总,图像识别实战,图像识别领域有哪些常用算法,图像识别算法汇编,图像识别实战,图像识别算法汇编,图像识别算法汇总,图像识别算法汇编,内容如对您有帮助,希望把文章链接给更多的朋友!

如今,人工智能和计算机视觉在我们身边无处不在:要求Siri安排下一次财务会议,使用面部识别解锁手机等。人工智能与计算机视觉是科技行业的突出话题。人工智能依赖于许多不同的工具和技术来模仿人类智能,并通过在不同设备上应用的各种算法来重建它。计算机视觉是一个关注机器分析和理解图像和视频的能力的IT领域,它在机器学习中完成图像识别的任务。

什么是图像识别?

图像识别是一种机制,用于识别图像中的对象,并根据人类识别不同图像集中对象的方式将其分类为特定类别。

图像识别如何为人类工作?

当我们看到一个物体或图像时,作为人类,我们能够立即准确地知道它是什么。人们根据我们在一组物体上识别的属性,将他们所看到的一切分类为不同类别。这样,即使我们不知道物体是什么,我们通常也能够将其与我们过去见过的不同类别的物体进行比较,并根据其属性对其进行分类。让我们以一种我们不认识的动物为例。即使我们不能清楚地识别它是什么动物,我们仍然能够识别它是一种动物。

人们很少思考他们观察事情是什么,以及如何识别物体,这完全是在潜意识中发生的。人们并不总是关注周围的一切。根据我们以前的经验,也就是说,我们的大脑经过训练,能够很容易地识别物体,也就是我们过去已经遇到过的物体。我们确实有一种非凡的推理能力:当我们看到类似于我们以前见过的物体的东西时,我们能够推断出它属于某一类物品。我们不一定需要查看图像的每个部分来识别其中的对象。一旦你看到你认出的物品的一部分,你就知道它是什么。我们通常使用颜色和对比度来识别物品。 对于人类来说,大多数图像识别都是在潜意识中工作的。但是,当涉及到机器的图像识别时,它要复杂得多。

图像识别如何与机器一起工作?

机器只识别我们编程的对象类别。他们天生无法知道和识别他们所看到的一切。如果机器被编程为识别一类图像,它将无法识别程序之外的任何其他图像。机器只能指定一组图像中存在的对象是否对应于该类别。机器是否会尝试将对象放入类别中,还是会完全忽略它。 对于机器,图像仅由数据、像素值数组组成。每个像素包含有关红色、绿色和蓝色颜色值的信息(每个像素从0到255)。对于黑白图像,像素将具有关于暗度和白度值的信息(对于这两个值,从0到255)。 机器不看整个图像;他们只对像素值和这些值中的模式感兴趣。他们只需获取一个项目的像素模式,并将其与其他模式进行比较。如果两个模式足够接近,机器会将它们关联起来,并将第二个模式识别为过去已经遇到过的模式。从这个意义上讲,正在发生的事情是,机器将在图像中寻找相似像素值的组,并将尝试将它们放在特定的图像类别中。 程序100%识别图像是非常罕见的。像素图案在比较时很少100%相同。解决这些问题并找到改进是IT研究人员的工作,其目标是向用户提出可能的最佳体验。

通过机器学习练习图像识别

图像识别的目标是识别、标记和分类检测到的不同类别的对象。物体或图像识别是一个涉及各种传统计算机视觉任务的完整过程:

图像分类:标记图像并创建类别。目标定位:通过用边界框包围对象来识别图像中对象的位置。目标检测:在边界框的帮助下确定对象的存在,并在其所属的类中对其进行分类。目标分割:区分各种元素。识别并定位图片中的每一项。分割不使用边界框,而是突出显示图像中对象的轮廓。

在过去几年中,这项计算机视觉任务取得了巨大的成功,主要得益于机器学习应用。

流程和模型

为了完成这4项任务,机器学习和图像识别系统确实需要完成几个重要步骤。

设置、训练和测试

首先,机器必须确切地知道它要寻找什么。因此,有必要为其提供您决定要处理的参数。定义边界框的尺寸和其中的元素至关重要。为此,机器必须提供一些参考资料,可以是图片、视频或照片等。这些元素将使其在分析未来数据时更有效。这将创建一种数据库,然后由神经网络用于区分各种对象。神经网络由多个人工神经元组成。这些神经元旨在模仿人脑。它与一组不同的算法一起工作,也受到大脑功能的启发。如果我们想让图像识别模型分析和分类不同种族的狗,那么模型需要有一个不同种族的数据库来识别它们。

第二,模型需要进入训练阶段。数据集需要在程序中输入才能正常运行。这一阶段只是为了训练卷积神经网络(CNN)来识别特定的对象,并将它们准确地组织在对应的类中。

在使用人工智能模型之前,需要对其进行彻底测试。要做到这一点,有必要提出不属于培训阶段的图像。根据项目是否能够识别所有项目以及分类的准确性,模型将被批准或不被批准。

以下是一些最流行的机器学习模型图像识别及其工作原理。

机器学习图像识别支持矢量机(SVM)

SVM模型使用一组技术来创建一种算法,该算法将确定图像是否对应于目标对象。根据设置的数据集,SVM模型被训练为将超计划分成几个类别。在此过程中,根据像素值,对象被放置在超计划中,它们的位置基于从训练阶段学习到的类别分离来预测类别。

图像检索模型

模型考虑了要分析的图像和参考样本照片。然后,模型中的算法尝试将样本照片中的像素模式与目标图片的某些部分进行匹配,以进行分析

Viola-Jones算法

这是用于面部识别的最著名的工具之一。甚至在使用CNNs之前就已经使用了它。它扫描人脸,从人脸中提取一些特征,并对其进行分类。它还使用了一种增强算法,旨在帮助进行更准确的分类。

卷积神经网络图像识别算法汇总(图像识别算法汇总表)

我们在本文早些时候已经讨论过CNN。但有必要对这一概念再深入一点。 机器学习依赖于人脑给予它的东西。它主要由人监督,首先是在传送一组参考图像时,训练机器识别物体并测试方法。CNN是深度学习技术的一种特定模型架构。CNN算法允许机器以令人印象深刻的精度检测和分类图片中观察到的所有对象。 这种算法适用于不同层次的感知。通常很难解释最终预测中特定层的作用,但研究已经取得了进展。例如,我们可以解释一个层分析颜色、另一个形状、对象的下一个纹理等。在过程结束时,所有层的叠加使预测成为可能。

目标检测算法主要分为两类:

Two-stage方法:如R-CNN系列算法,主要思路就是通过Selective Search或者CNN网络产生一系列的稀疏矩阵的候选区域,然后对这些候选区域进行分类和回归,two-stage的方法优势在于准确率度高;One-stage方法:如YOLO系列方法,主要思路就是均匀地在图片上不同位置进行密集采样,采样时使用不同尺度和长宽比box,然后利用CNN提取特征后直接进行分类和回归,整个过程只需要一步,所以优势在于速度快。我们接下来介绍的SSD方法也是单阶段的算法。

深度学习已证明在检测对象和对其进行分类方面非常有效。有不同的方法,每个方法都有自己的特点。以下是其中三个程序

基于区域FasterRCNN

更快的RCNN是一种基于区域分析的卷积神经网络算法。当分析新图像时,在使用参考集进行训练后,Faster RCNN将在图片中提出可能发现对象的一些区域。当算法检测到感兴趣的区域时,这些区域随后被边界框包围并裁剪,然后被分析以分类在适当的类别内。为什么它被称为更快的RCNN?因为通过提出可能放置对象的区域,它允许算法进行得更快,因为程序不必在整个图像中导航来分析每个像素模式。

SSD

使用单发探测器算法与RCNN直接相关。在识别和绘制边界框时,大多数情况下,它们彼此重叠。这是使用SSD的主要原因。为了防止这些框重叠,SSD使用具有不同比率的网格来划分图像。然后,如果我们观察到一个盒子放在另一个盒子的上面,例如,因为系统检测到一个女孩在汽车前面,算法建议创建两个不同的锚框,以便将这两个物品分开。这样,图片被划分为不同的特征平面,并被单独处理,机器能够处理更多对象的分析。这项技术显示非常成功、准确,并且可以快速执行。

YOLO

正如算法的名称所暗示的,由于网格大小固定,该技术只能一次性处理整个图片。它在网格的每个部分中查找元素,并确定是否有任何项目。如果是这样,它将被识别为丰富的盒子,然后将其分类。只查看一次网格会使过程变得非常快速,但存在方法不深入细节的风险。结果不如SSD方法准确。

机器学习图像识别的不同应用领域

如今,计算机视觉和识别一直在我们身边。从早上用脸打开手机,到走进商场购物。许多不同的行业已决定在其流程中实施人工智能。

面部识别

人脸分析是一种主要的识别应用。许多公司都使用它来同时检测不同的人脸,例如,为了知道图像中有多少人。警方和安全部队可以使用人脸识别来识别罪犯或受害者。人脸分析涉及性别检测、情绪估计、年龄估计等。

企业识别这些特征的需要很容易理解。它使他们能够准确地分析他们的客户是谁。这样,一家时装店就可以意识到,它的顾客由80%的女性组成,平均年龄在30到45岁之间,顾客似乎不喜欢店里的一篇文章。当他们看到这条绿色裙子时,他们的面部表情往往会感到失望。了解所有这些细节对于他们了解目标并在未来调整沟通至关重要。

面部分析也非常用于识别。苹果最近开发了一种用脸解锁手机的方法。他们甚至开发了一种不摘下外科口罩的方法。

健康与医学

治疗患者可能具有挑战性,有时检查过程中可能会漏掉一个微小的因素,导致医护人员提供错误的治疗。为了防止这种情况发生,医疗保健系统开始分析治疗期间获取的图像。X射线照片、收音机、扫描,所有这些图像材料都可以使用图像识别来检测从一个点到另一个点的单个变化。检测肿瘤、病毒的进展、静脉或动脉异常的出现等。

智慧农业

农民的日常生活远非易事。为了继续照顾好他们的动物和种植园,他们需要监控它们。

对农民来说,监测牲畜已经成为一种舒适的养牛方式。通过配备运动传感器和图像检测程序的摄像机,他们能够确保所有动物的健康。他们还可以监测动物的出生情况。农民可以很容易地发现母牛是否在生小牛时遇到困难。他们可以迅速干预,帮助动物分娩,从而防止两只动物的潜在死亡。

农民也种植自己的植物,主要是为了喂牛。为了查看田地是否健康,可以对图像识别进行编程,以检测植物上是否存在疾病。农民可以迅速处理种植园,并能够和平收获。

安保和安全

安全和保障是当今社会的两大关注点。由于图像识别和检测,识别罪犯或受害者甚至武器变得更加容易。例如,在安全至关重要的机场。整天,安全人员都在仔细检查屏幕。在人工智能的帮助下,他们能够非常迅速地发现危险。当一件行李无人看管时,监视人员可以立即与现场官员取得联系,以便尽快控制局势并保护群众。当出示护照时,会对个人的指纹和面部进行分析,以确保其与原始文件相符。

保险公司也在使用识别技术。当有人投诉抢劫案并要求保险公司赔偿时。后者定期要求受害者提供视频片段或监控图像,以证明重罪确实发生。很多时候,小偷会被摄像头拍到,并被识别出来。有时,有罪的个人会被起诉,并可能因面部识别而面临指控。

电子商务

自新冠肺炎疫情爆发以来,网上商店正经历一场繁荣。由于各种因素,他们设法以指数方式发展自己的活动。

他们最近取得的进步之一是图像识别,以更好地为客户服务。许多平台现在能够根据他们之前观看的内容,识别他们网购者最喜欢的产品,并向他们推荐新的购买商品。

另一方面,一些新的应用程序建议用户只需拍摄他们在街上遇到的人身上发现的物品的照片,就可以找到一家有类似或相同物品可供购买的商店。然后,该算法能够给出一个你可以购买你朋友今天穿的鞋子的地方列表。

过去几十年来,人工智能和图像识别领域取得了巨大的进步。毫无疑问,研究人员已经在寻找基于这些特殊技术提供的所有可能性的新技术。

本文链接地址:https://www.jiuchutong.com/zhishi/300373.html 转载请保留说明!

上一篇:【论文阅读】RePaint: Inpainting using Denoising Diffusion Probabilistic Models(CVPR 2022)(论文resit)

下一篇:JS 数组中的 filter 方法(js 数组中的重数)

  • 咸阳大健康微信公众号如何关注(咸阳市民健康码)

    咸阳大健康微信公众号如何关注(咸阳市民健康码)

  • 微信怎样退群(微信怎样退群不会引起别人注意)

    微信怎样退群(微信怎样退群不会引起别人注意)

  • 华为授权体验店是不是官方的(华为授权体验店和专卖店的区别)

    华为授权体验店是不是官方的(华为授权体验店和专卖店的区别)

  • zenly冻结位置看得到电量吗(zenly冻结定位对方看不看的了现在的位置)

    zenly冻结位置看得到电量吗(zenly冻结定位对方看不看的了现在的位置)

  • 台电和台积电是一个吗(台电和台积电是什么关系)

    台电和台积电是一个吗(台电和台积电是什么关系)

  • mate30怎么充电比较不伤电池(华为mate 30怎么充电)

    mate30怎么充电比较不伤电池(华为mate 30怎么充电)

  • 计算机网络物理安全策略是指(计算机网络物理层特性)

    计算机网络物理安全策略是指(计算机网络物理层特性)

  • tepyc接口是什么手机(tepyc接口有什么用)

    tepyc接口是什么手机(tepyc接口有什么用)

  • 入网资格校验失败是什么意思(入网资格校验失败该号码为公安涉案号码)

    入网资格校验失败是什么意思(入网资格校验失败该号码为公安涉案号码)

  • 抖音极速版直播间怎么进入(抖音极速版直播能赚钱吗)

    抖音极速版直播间怎么进入(抖音极速版直播能赚钱吗)

  • oppoa11支不支持无线充电(oppoa11支不支持红外线)

    oppoa11支不支持无线充电(oppoa11支不支持红外线)

  • 绿色软件和非绿色软件区别(绿色软件和非绿色软件举例)

    绿色软件和非绿色软件区别(绿色软件和非绿色软件举例)

  • 手机充电器三种分类(手机充电器三种接口图片)

    手机充电器三种分类(手机充电器三种接口图片)

  • 一加dc调光有什么用(一加的dc调光真的有用吗)

    一加dc调光有什么用(一加的dc调光真的有用吗)

  • 怎么在word图片上编辑文字(怎么在word图片上做标记)

    怎么在word图片上编辑文字(怎么在word图片上做标记)

  • 手机wps怎么打印(手机wps怎么打印图片)

    手机wps怎么打印(手机wps怎么打印图片)

  • 蓝墨云可以远程签到吗(蓝墨云老师发的资源怎么下载)

    蓝墨云可以远程签到吗(蓝墨云老师发的资源怎么下载)

  • Mac怎么设置输入法切换快捷键?Mac设置输入法切换快捷键方法(macbook怎么设置输入法)

    Mac怎么设置输入法切换快捷键?Mac设置输入法切换快捷键方法(macbook怎么设置输入法)

  • 华为手机开热点方法(华为手机开热点后wlan自动关闭)

    华为手机开热点方法(华为手机开热点后wlan自动关闭)

  • Loughrigg Tarn的日出,英国英格兰湖区安布尔塞德 (© John Finney photography/Getty Images)

    Loughrigg Tarn的日出,英国英格兰湖区安布尔塞德 (© John Finney photography/Getty Images)

  • js原型的实时性介绍(js原型函数)

    js原型的实时性介绍(js原型函数)

  • 发票没有申报能开票吗
  • 买一赠一的税务处理
  • 附加税的计算公式2023
  • 超过两年记入错误的主营业务成本怎么调账
  • 年终奖计入工伤赔偿
  • 收到红字发票如何申报增值税?
  • 财政补助结转会计处理
  • 2020劳务退税怎么退
  • 资产总额全年季度平均值怎么填写
  • 待抵扣进项税额怎么算
  • 行政事业单位盘亏或毁损的固定资产
  • 不相关企业之间的关系
  • 结转折旧费会计分录
  • 预付房租发票未到分录
  • 企业未能实施个人所得税代扣代缴是否会罚款呢?
  • 公司名下没有车可以开运输发票吗
  • 融资租赁的固定资产由承租方进行核算,体现了( )原则
  • 超出发票使用范围
  • 案例分析建筑业差额征税如何进行账务处理?
  • 母子公司之间转让土地使用权
  • 管理费用进项抵扣比例是多少?怎么算
  • 小规模红字发票怎么做账务处理
  • 物流分公司怎么运作
  • 进项增值税发票怎么认证
  • 拿到农产品0税率的发票可以抵扣吗
  • 何时进行文化事业建设
  • 去年的税金没有计提
  • 事业单位财政直接支付了费用忘记入帐
  • windows已禁用
  • 吊兰怎么养才能开花
  • sentstrt.exe - sentstrt进程是什么文件 有什么用
  • 进项抵扣发票如何查询
  • 预付办公用品费用,未收到发票
  • php实现分页显示
  • thinkphp exec
  • 长期借款的利息计入
  • echarts series name
  • pilot coat
  • php中split
  • 业务招待费可以结转以后年度扣除吗
  • 个体工商户开增值税专用发票
  • 租金算营业成本还是管理费用
  • 安装php5.6
  • 销售折扣收货方法有哪些
  • 电子发票报销需要签字吗
  • 股东增资涉税
  • 分公司是独立的诉讼主体吗
  • 公司基本户里的钱有利息吗
  • 支付宝和微信的财务统计
  • 市政道路基础设施
  • 融资租入固定资产的租赁费属于什么费用
  • 电影剧本稿费多少
  • 企业税负是否包含增值税
  • 财务费用是负数什么意思
  • 工厂用的工具放计入哪个科目
  • 已入库的原材料会计分录
  • 银行账户是不是卡号
  • 餐饮费与业务招标的关系
  • 旅行社的代订机票产品能报销吗
  • sql sever实验指导
  • win7组织在哪
  • 提高搜索
  • VMware虚拟机安装Android系统
  • windows没网络是怎么回事
  • windows任务栏变色
  • win8关闭系统更新
  • 怎样查看windows10版本
  • windows10x预览版
  • win8设备管理器没有端口
  • javascript概述及作用
  • node connect
  • 我为什么要
  • opengl编程实例
  • css放大字体
  • nodejs发送post请求
  • node.js入门教程
  • andorids
  • Python文本相似性计算之编辑距离详解
  • python压缩文件为gz
  • 代收的款项支付需不需要开发票
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设