位置: IT常识 - 正文

opencv训练自己的模型,实现特定物体的识别(opencv训练模型教程)

编辑:rootadmin
opencv训练自己的模型,实现特定物体的识别 1.说明opencv安装包中有训练好的分类器文件,可以实现人脸的识别。当然,我们也可以训练自己的分类器文件,实现对特定物体的识别。本文章就详细介绍下如何训练自己的分类器文件。2.效果我训练的是检测苹果的的分类器文件,可以实现对苹果的识别。 3.准备3.1 程序准备训练自己的分类器文件,需要用到两个程序 : opencv_createsamples.exe和opencv_traincascade.exeopencv最新的安装包中没有这两个程序,我们可以下载 3.4.14这个版本的安装包进行安装。opencv安装包 : opencv-3.4.14-vc14_vc15.exe安装完成后,在这个目录下就会有这两个程序文件 opencv\build\x64\vc15\bin3.2 样本数据准备

推荐整理分享opencv训练自己的模型,实现特定物体的识别(opencv训练模型教程),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:opencv训练模型教程,opencv自学,opencv训练xml,opencv训练模型教程,opencv训练模型教程,opencv训练模型教程,opencv 训练自己的svm,opencv训练模型教程,内容如对您有帮助,希望把文章链接给更多的朋友!

正样本数据 : 也就是我们需要检测的物体图片,可以自己用手机拍摄下你要检测的物体的图片,多拍摄一些不同角度的图片。

我的正样本数据在这个目录下 image\positive\img,大概有50多张图片

然后在image\positive目录下新建一个info.dat文件,在其中记录正样本图片信息

opencv训练自己的模型,实现特定物体的识别(opencv训练模型教程)

参数介绍

img/1.jpg : 文件路径和文件名1:表示图片中有几个目标物体,一般一个就行了0,0:目标物体起始坐标1280,1706:目标物体大小

负样本数据:不包含我们要检测物体的图片,可以拍摄一些风景之类的图片,尽量多一些。

我的负样本数据在这个目录下 image\negitive\img

然后在image\negitive目录下新建一个bg.txt文件,在其中记录负样本图片信息

负样本图片信息我们只需记录路径和文件名就行了,但是这里要注意,路径名要写绝对路径,后面会说为什么。

3.3 正样本VEC文件创建训练样本之前先要生成vec文件,要用到opencv_createsamples.exe程序opencv_createsamples.exe部分参数介绍 [-info <collection_file_name>] # 记录样本数据的文件(就是我们刚才创建的info.data文件) [-img <image_file_name>] [-vec <vec_file_name>] # 输出文件,内含用于训练的正样本。 [-bg <background_file_name>] # 背景图像的描述文件 [-num <number_of_samples = 1000>] #样本数量(默认为1000) [-bgcolor <background_color = 0>] #指定背景颜色 [-w <sample_width = 24>]#输出样本的宽度(以像素为单位) [-h <sample_height = 24>]#输出样本的高度(以像素为单位)

参考

在安装包的这个目录下opencv\build\x64\vc15\bin可以找到opencv_createsamples.exe程序,我们生成下vec文件D:\opencv3.4.12\opencv\build\x64\vc15\bin\opencv_createsamples.exe -info C:\Users\lng\Desktop\image\positive\info.dat -vec C:\Users\lng\Desktop\image\sample.vec -num 58 -bgcolor 0 -bgthresh 0 -w 24 -h 24在image目录下就生成了vec文件 4.样本数据训练完成上面的准备工作,就可以开始训练样本。训练样本需要用到opencv_traincascaded.exe程序opencv_traincascaded.exe程序部分参数介绍 -data <cascade_dir_name> #目录名,如不存在训练程序会创建它,用于存放训练好的分类器 -vec <vec_file_name> #包含正样本的vec文件名 -bg <background_file_name> #背景描述文件 [-numPos <number_of_positive_samples = 2000>] #每级分类器训练时所用的正样本数目 [-numNeg <number_of_negative_samples = 1000>] #每级分类器训练时所用的负样本数目 [-numStages <number_of_stages = 20>] #训练的分类器的级数--cascadeParams-- [-featureType <{HAAR(default), LBP, HOG}>] # 特征的类型: HAAR - 类Haar特征; LBP - 局部纹理模式特征 [-w <sampleWidth = 24>] #训练样本的尺寸(单位为像素) [-h <sampleHeight = 24>] #训练样本的尺寸(单位为像素)--boostParams-- [-minHitRate <min_hit_rate> = 0.995>] #分类器的每一级希望得到的最小检测率 [-maxFalseAlarmRate <max_false_alarm_rate = 0.5>] #分类器的每一级希望得到的最大误检率

参考

在安装包的这个目录下opencv\build\x64\vc15\bin可以找到opencv_traincascade.exe程序,开始训练样本这里注意下

指定-bg参数时,文件名前不能加路径,所以需要把刚才在image\negitive下创建的bg.txt文件拷贝到opencv_traincascade.exe程序所在目录下,所以要在bg.txt写负样本图片的绝对路径。指定numPos参数时,因为每个阶段训练时有些正样本可能会被识别为负样本,故每个训练阶段后都会消耗一定的正样本。因此,此处使用的正样本数量绝对不能等于或超过positive文件夹下的正样本个数,一般留有一定的余量指定-numNeg参数时,可以多于negitive目录下的负样本数量D:\opencv3.4.12\opencv\build\x64\vc15\bin\opencv_traincascade.exe -data C:\Users\lng\Desktop\image -vec C:\Users\lng\Desktop\image\sample.vec -bg bg.txt -numPos 50 -numNeg 500 -numStages 12 -feattureType HAAR -w 24 -h 24 -minHitRate 0.995 -maxFalseAlarmRate 0.5执行结果PARAMETERS:cascadeDirName: C:\Users\lng\Desktop\imagevecFileName: C:\Users\lng\Desktop\image\sample.vecbgFileName: bg.txtnumPos: 50numNeg: 500numStages: 12precalcValBufSize[Mb] : 1024precalcIdxBufSize[Mb] : 1024acceptanceRatioBreakValue : -1stageType: BOOSTfeatureType: HAARsampleWidth: 24sampleHeight: 24boostType: GABminHitRate: 0.995maxFalseAlarmRate: 0.5weightTrimRate: 0.95maxDepth: 1maxWeakCount: 100mode: BASICNumber of unique features given windowSize [24,24] : 162336===== TRAINING 0-stage =====<BEGINPOS count : consumed 50 : 50NEG count : acceptanceRatio 500 : 1Precalculation time: 0.581+----+---------+---------+| N | HR | FA |+----+---------+---------+| 1| 1| 1|+----+---------+---------+| 2| 1| 0.05|+----+---------+---------+END>Training until now has taken 0 days 0 hours 0 minutes 1 seconds.===== TRAINING 1-stage =====<BEGINPOS count : consumed 50 : 50NEG count : acceptanceRatio 500 : 0.084832Precalculation time: 0.576+----+---------+---------+| N | HR | FA |+----+---------+---------+| 1| 1| 1|+----+---------+---------+| 2| 1| 0.146|+----+---------+---------+END>Training until now has taken 0 days 0 hours 0 minutes 3 seconds.===== TRAINING 2-stage =====<BEGINPOS count : consumed 50 : 50NEG count : acceptanceRatio 500 : 0.0149993Precalculation time: 0.592+----+---------+---------+| N | HR | FA |+----+---------+---------+| 1| 1| 1|+----+---------+---------+| 2| 1| 0.186|+----+---------+---------+END>Training until now has taken 0 days 0 hours 0 minutes 5 seconds.===== TRAINING 3-stage =====<BEGINPOS count : consumed 50 : 50NEG count : acceptanceRatio 500 : 0.00288033Precalculation time: 0.652+----+---------+---------+| N | HR | FA |+----+---------+---------+| 1| 1| 1|+----+---------+---------+| 2| 1| 0.298|+----+---------+---------+END>Training until now has taken 0 days 0 hours 0 minutes 7 seconds.===== TRAINING 4-stage =====<BEGINPOS count : consumed 50 : 50NEG count : acceptanceRatio 500 : 0.000768845Precalculation time: 0.615+----+---------+---------+| N | HR | FA |+----+---------+---------+| 1| 1| 1|+----+---------+---------+| 2| 1| 1|+----+---------+---------+| 3| 1| 0.366|+----+---------+---------+END>Training until now has taken 0 days 0 hours 0 minutes 11 seconds.===== TRAINING 5-stage =====<BEGINPOS count : consumed 50 : 50NEG count : acceptanceRatio 500 : 0.000375057Precalculation time: 0.61+----+---------+---------+| N | HR | FA |+----+---------+---------+| 1| 1| 1|+----+---------+---------+| 2| 1| 1|+----+---------+---------+| 3| 1| 0.366|+----+---------+---------+END>Training until now has taken 0 days 0 hours 0 minutes 15 seconds.===== TRAINING 6-stage =====<BEGINPOS count : consumed 50 : 50NEG count : acceptanceRatio 2 : 0.00016276Required leaf false alarm rate achieved. Branch training t训练完成后,在img目录下就会生成以下文件。 cascade.xml就是我们需要的分类器文件,其他都是过程文件。5.测试代码main.cpp#include <iostream>#include <opencv2/opencv.hpp>char* face_cascade_name = "C:\\Users\\lng\\Desktop\\image\\cascade.xml";void faceRecongize(cv::CascadeClassifier faceCascade, cv::Mat frame);int main(){ cv::VideoCapture *videoCap = new cv::VideoCapture;cv::CascadeClassifier faceCascade; // 加载苹果分类器文件if (!faceCascade.load(face_cascade_name)) {std::cout << "load face_cascade_name failed. " << std::endl;return -1;} // 打开摄像机videoCap->open(0);if (!videoCap->isOpened()) {videoCap->release();std::cout << "open camera failed"<< std::endl; return -1;}std::cout << "open camera success"<< std::endl; while(1){cv::Mat frame;//读取视频帧videoCap->read(frame);if (frame.empty()) {videoCap->release();return -1;} //进行苹果识别faceRecongize(faceCascade, frame); //窗口进行展示 imshow("face", frame); //等待回车键按下退出程序if (cv::waitKey(30) == 13) {cv::destroyAllWindows();return 0;} } system("pause"); return 0;}void faceRecongize(cv::CascadeClassifier faceCascade, cv::CascadeClassifier eyesCascade, cv::CascadeClassifier mouthCascade, cv::Mat frame) {std::vector<cv::Rect> faces; // 检测苹果faceCascade.detectMultiScale(frame, faces, 1.1, 2, 0 | cv::CASCADE_SCALE_IMAGE, cv::Size(30, 30));for (int i = 0; i < faces.size(); i++) { // 用椭圆画出苹果部分 cv::Point center(faces[i].x + faces[i].width / 2, faces[i].y + faces[i].height / 2);ellipse(frame, center, cv::Size(faces[i].width / 2, faces[i].height / 2), 0, 0, 360, cv::Scalar(255, 0, 255), 4, 8, 0);cv::Mat faceROI = frame(faces[i]);std::vector<cv::Rect> eyes; // 苹果上方区域写字进行标识cv::Point centerText(faces[i].x + faces[i].width / 2 - 40, faces[i].y - 20);cv::putText(frame, "apple", centerText, cv::FONT_HERSHEY_SIMPLEX, 1, cv::Scalar(0, 0, 255), 2);}}CMakeListscmake_minimum_required (VERSION 3.5)project (faceRecongize2015)MESSAGE(STATUS "PROJECT_SOURCE_DIR " ${PROJECT_SOURCE_DIR})SET(SRC_LISTS ${PROJECT_SOURCE_DIR}/src/main.cpp)set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -std=c++11")#set(CMAKE_AUTOMOC ON)#set(CMAKE_AUTOUIC ON)#set(CMAKE_AUTORCC ON)# 配置头文件目录include_directories(${PROJECT_SOURCE_DIR}/src)include_directories("D:\\opencv3.4.12\\opencv\\build\\include")include_directories("D:\\opencv3.4.12\\opencv\\build\\include\\opencv2")# 设置不显示命令框if(MSVC)#set(CMAKE_EXE_LINKER_FLAGS "${CMAKE_EXE_LINKER_FLAGS} /SUBSYSTEM:WINDOWS /ENTRY:mainCRTStartup")endif()# 添加库文件set(PRO_OPENCV_LIB "D:\\opencv3.4.12\\opencv\\build\\x64\\vc15\\lib\\opencv_world3412.lib" "D:\\opencv3.4.12\\opencv\\build\\x64\\vc15\\lib\\opencv_world3412d.lib")IF(WIN32) # 生成可执行程序ADD_EXECUTABLE(faceRecongize2015 ${SRC_LISTS})# 链接库文件 TARGET_LINK_LIBRARIES(faceRecongize2015 ${PRO_OPENCV_LIB})ENDIF()6.编译说明我的opencv 3.4.12的安装路径是 D:\opencv3.4.12目录结构- src - mian.cpp- build_x64- CMakeLists编译命令, 在build_x64目录下执行cmake -G "Visual Studio 14 2015 Win64" ..cmake --build ./ --config Release编译完成后拷贝D:\opencv3.4.12\opencv\build\x64\vc15\bin目录下的opencv_world3412.dll和opencv_world3412d.dll到可执行程序目录下。备注经过测试,自己训练的样本,准确度还是比较差的。可能是正样本数据太少,且图片背景占据位置较多。要提高准确度,首先增加正样本图片数量,还要就是尽量让你的目标物体占满整个图片,不要留有太多的背景。而且也要有尽可能多的负样本数据。
本文链接地址:https://www.jiuchutong.com/zhishi/297605.html 转载请保留说明!

上一篇:基于yoloV7添加关键点训练记录(yolov5 教程)

下一篇:使用小程序实现AI动漫脸特效(使用小程序实现im)

  • 一切都是为了营销,除了营销。营销是为了产品(一切都是为了什么的说说)

    一切都是为了营销,除了营销。营销是为了产品(一切都是为了什么的说说)

  • 警视卫摄像头怎么连接手机(警视卫摄像头怎么样)

    警视卫摄像头怎么连接手机(警视卫摄像头怎么样)

  • 支付宝核酸采样码在哪里查询(支付宝核酸采样码在哪里找)

    支付宝核酸采样码在哪里查询(支付宝核酸采样码在哪里找)

  • 万网域名赎回是什么意思(赎回域名那么贵)

    万网域名赎回是什么意思(赎回域名那么贵)

  • 华为freebuds3有线和无线的区别(华为freebuds3有线版和无线版有什么区别)

    华为freebuds3有线和无线的区别(华为freebuds3有线版和无线版有什么区别)

  • oppo伸缩摄像头的手机(oppo伸缩摄像头手机)

    oppo伸缩摄像头的手机(oppo伸缩摄像头手机)

  • 小程序调试信息是什么意思(小程序调试信息怎么删除)

    小程序调试信息是什么意思(小程序调试信息怎么删除)

  • 微信换实名认证零钱怎么办(微信换实名认证后好友还在吗)

    微信换实名认证零钱怎么办(微信换实名认证后好友还在吗)

  • 电脑经常蓝屏怎么办(电脑经常蓝屏怎么修复)

    电脑经常蓝屏怎么办(电脑经常蓝屏怎么修复)

  • 抖音如何复制文案(抖音如何复制文字)

    抖音如何复制文案(抖音如何复制文字)

  • oppor9s怎么在桌面隐藏应用(oppor9s怎么设置桌面)

    oppor9s怎么在桌面隐藏应用(oppor9s怎么设置桌面)

  • 手机投屏为啥不是全屏(手机投屏为啥不清楚)

    手机投屏为啥不是全屏(手机投屏为啥不清楚)

  • ctrl加什么是新建文档(ctrl加啥)

    ctrl加什么是新建文档(ctrl加啥)

  • ipada2152是什么型号(ipada2152是国行吗)

    ipada2152是什么型号(ipada2152是国行吗)

  • ipad a1538是什么型号(ipad a1538)

    ipad a1538是什么型号(ipad a1538)

  • 荣耀v30支持红外吗(荣耀v30支持红外遥控吗)

    荣耀v30支持红外吗(荣耀v30支持红外遥控吗)

  • wps如何快速查找内容(wps如何快速查找重复值)

    wps如何快速查找内容(wps如何快速查找重复值)

  • 计算机csp是什么意思(计算机csp考试内容)

    计算机csp是什么意思(计算机csp考试内容)

  • 苹果传照片到安卓手机(苹果传照片到安卓手机是反的怎么办)

    苹果传照片到安卓手机(苹果传照片到安卓手机是反的怎么办)

  • iphonexsmaxnfc功能怎么打开(苹果手机xsmaxnfc功能)

    iphonexsmaxnfc功能怎么打开(苹果手机xsmaxnfc功能)

  • a1431是苹果几(a1431是苹果几多少钱)

    a1431是苹果几(a1431是苹果几多少钱)

  • 如何在淘宝店铺中设置背景颜色(如何在淘宝店铺中找到所有订单)

    如何在淘宝店铺中设置背景颜色(如何在淘宝店铺中找到所有订单)

  • 240hz显示器推荐,五款240hz专业电竞显示器推荐(台式机显示器推荐)

    240hz显示器推荐,五款240hz专业电竞显示器推荐(台式机显示器推荐)

  • CSS6大种选择器(超详细!!!!!!)(css常见的选择器有哪几种)

    CSS6大种选择器(超详细!!!!!!)(css常见的选择器有哪几种)

  • 委托加工应税消费品收回后直接销售
  • 返点的保险费应计入哪里
  • 资产负债表税务报表中其他应收款可以为负数吗
  • 合同负债与预计负责区别
  • 应收利息对应什么科目
  • 银行承兑汇票贴现利率一般多少
  • 债权投资损失准备
  • 购买毛巾的费用是多少
  • 免税企业取得增值税专用发票怎么处理
  • 财产租赁合同印花税率多少
  • 积分小技巧
  • 取得抵债房产的涉税风险,你清楚吗?
  • 公司为员工交的五险一金到底是怎么回事
  • 上月销售的货物会计分录
  • 研发费用界定标准
  • 委托代销商品会计分录按成本还是售价
  • 劳务费和服务费一样吗
  • 床垫专票可以抵扣吗
  • 个税汇算清缴包含退休金吗
  • 无线路由器1200m覆盖范围
  • 个人所得税专项扣除夫妻双方都填吗?
  • fsrec.sys
  • 360pci.exe
  • 中拍网拍卖
  • 竞业限制违反了怎么办
  • 大堡礁分布在澳大利亚的哪里
  • 什么情况下附加税减半征收
  • 对抗生成网络算法
  • vue路由详解
  • 使用什么指令可以清空memcached数据库中的所有数据
  • 应交增值税的账务处理有哪两种
  • 一般纳税人普通发票做账
  • 从网上学电脑下载什么软件
  • 出差的招待费算差旅费
  • PostgreSQL教程(七):函数和操作符详解(3)
  • 分派现金股利处理
  • 通用机打的发票
  • 亏损企业所得税汇算清缴怎么做
  • 零申报公司注销流程
  • 亏损企业研发费用必须加计扣除吗
  • 员工借款的定义
  • 门市装修费用会计处理
  • 利润与所有者权益的区别
  • 因自然灾害发生固定资产净损失
  • 建筑公司异地施工
  • 工商联络注册
  • 公司流水账怎么做
  • 流动比率和速动比率过高说明什么
  • mysql的innodb和myisam
  • 一个查看明日方舟的网站
  • 快速释放剪贴蒙版快捷键
  • mac系统不能用
  • linux内核模块编译步骤
  • freebsd 配置ip
  • win7旗舰版32位系统激活
  • 360win7
  • Win10 Mobile RS2预览版14926更新与修复内容汇总
  • 进不去操作系统 怎么样修复引导
  • win7开始菜单没有启动文件夹
  • win7关闭操作中心图标
  • win7开机屏幕狂闪不停怎么解决
  • linuxone
  • opengl learning
  • 适配器模型
  • css对象
  • cocos2d教程
  • jquery滚动条滚动到指定位置
  • textview在哪
  • pythonyield理解与用法
  • javascript数据结构与算法第三版
  • jquery设计模式
  • 预拍摄功能相机
  • Windows下Eclipse+PyDev配置Python+PyQt4开发环境
  • 如何查询纳税信用级别
  • 如何查询以前月份发票超限量的申请
  • 开票系统怎么升级?
  • 税务上的关联企业指哪些
  • 总公司和子公司是什么关系
  • 最近领导故意挑事
  • 对于批发企业和零售连锁企业的质量验收,错误的是( )
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设