位置: IT常识 - 正文

win10下 yolov8 tensorrt模型加速部署【实战】

编辑:rootadmin
win10下 yolov8 tensorrt模型加速部署【实战】 Windows10下yolov8 tensorrt模型加速部署【实战】

推荐整理分享win10下 yolov8 tensorrt模型加速部署【实战】,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

TensorRT-Alpha基于tensorrt+cuda c++实现模型end2end的gpu加速,支持win10、linux,在2023年已经更新模型:YOLOv8, YOLOv7, YOLOv6, YOLOv5, YOLOv4, YOLOv3, YOLOX, YOLOR,pphumanseg,u2net,EfficientDet。 关注仓库《TensorRT-Alpha》:https://github.com/FeiYull/TensorRT-Alpha Linux tensorrt yolov8保姆教程: https://blog.csdn.net/m0_72734364/article/details/128758544

一、加速结果展示1.1 性能速览

🚀快速看看yolov8n 在移动端RTX2070m(8G)的新能表现:

modelvideo resolutionmodel input sizeGPU Memory-UsageGPU-Utilyolov8n1920x10808x3x640x6401093MiB/7982MiB14%

下图是yolov8n的运行时间开销,单位是ms:

更多TensorRT-Alpha测试录像在B站视频: B站:YOLOv8n B站:YOLOv8s

1.2精度对齐

下面是左边是python框架推理结果,右边是TensorRT-Alpha推理结果。

yolov8n : Offical( left ) vs Ours( right )

yolov7-tiny : Offical( left ) vs Ours( right )

yolov6s : Offical( left ) vs Ours( right )

yolov5s : Offical( left ) vs Ours( right )

YOLOv4 YOLOv3 YOLOR YOLOX略。

二、Windows10环境配置

三步解决win环境配置:

1、安装vs2019、Nvidia驱动、cuda,cudnn、opencv、tensorrt;2、创建属性表;3、工程设置,运行; 问题:为什么使用vs2019属性表,而不用cmake? 回答:因为属性表可以做到:一次创建,到处使用。 提示:如果您一定需要使用cmake+vs2019 or cmake + clion,请参考附录,这是一位热心观众的方法,供参考。2.1 安装VS2019

需要Microsoft账号,如果您有别的途径下载安装也可以。

进入:https://visualstudio.microsoft.com/zh-hans/vs/older-downloads/选择:[2019] -> [下载]在新页面选择: Visual Studio Community 2019 (version 16.11)下载完成之后安装过程选择如下图: 重启系统2.2 安装库

注:Nvidia相关网站需要注册账号。

2.2.1 安装Nvidia显卡驱动进入: https://www.nvidia.cn/Download/index.aspx?lang=cn#依据实际情况选择,如下图是我的选择(for RTX3070): 选择:[搜索]->[下载] ->[双击默认安装] -> [重启系统] -> [进入cmd],输入如下指令:nvidia-smi

看到如下信息表明驱动正常:

2.2.2 安装 cuda11.2进入: https://developer.nvidia.com/cuda-toolkit-archive选择:CUDA Toolkit 11.2.0 (December 2020)选择:[Windows] -> [x86_64] -> [10] -> [exe(local)] -> [Download(2.9GB)]双击安装,重启在cmd窗口输入如下指令:nvcc -V

CMD窗口打印如下信息表示cuda11.2安装正常

nvcc: NVIDIA (R) Cuda compiler driverCopyright (c) 2005-2020 NVIDIA CorporationBuilt on Mon_Nov_30_19:15:10_Pacific_Standard_Time_2020Cuda compilation tools, release 11.2, V11.2.67Build cuda_11.2.r11.2/compiler.29373293_0win10下 yolov8 tensorrt模型加速部署【实战】

note:cuda11.2 不需要手动设置环境变量,如下图,环境变量都是自动设置的。

2.2.3 安装 cudnn8.2.1进入网站:https://developer.nvidia.com/rdp/cudnn-archive选择: Download cuDNN v8.2.1 (June 7th, 2021), for CUDA 11.x选择: cuDNN Library for Windows (x86)你将会下载这个压缩包: “cudnn-11.3-windows-x64-v8.2.1.32_2.zip”解压之后,cudnn的头文件、库文件都要拷贝到cuda安装目录。如下图,进入cudnn解压所在文件夹中include,拷贝所有头文件,粘贴到CUDA/v11.2/include中lib、bin中的文件也拷贝到对应cuda目录中重启系统 2.2.4 下载 tensorrt8.4.2.4进入网站: https://developer.nvidia.cn/nvidia-tensorrt-8x-download把这个打勾: I Agree To the Terms of the NVIDIA TensorRT License Agreement选择: TensorRT 8.4 GA Update 1选择: TensorRT 8.4 GA Update 1 for Windows 10 and CUDA 11.0, 11.1, 11.2, 11.3, 11.4, 11.5, 11.6 and 11.7 ZIP Package你将会下载这个压缩包: “TensorRT-8.4.2.4.Windows10.x86_64.cuda-11.6.cudnn8.4.zip”解压到F:\ThirdParty,并重命名为:TensorRT-8.4.2.4并将路径"F:\ThirdParty\TensorRT-8.4.2.4\lib"添加到环境变量,如下图:重启系统 2.2.5 OpenCV4.5.5安装进入:https://opencv.org/releases/选择:[OpenCV – 4.5.5] -> [Windows]下载完成之后,是一个exe的自解压格式,解压到:D:\ThirdParty并将路径:“D:\ThirdParty\opencv4.5.5\build\bin” 和 "D:\ThirdParty\opencv4.5.5\build\x64\vc15\bin"添加到环境变量,如下图:重启系统 note:我的opencv在D盘,tensorrt在E盘,根据实际情况修改就行了。 2.3 创建属性表

一般地,Visual Studio 2019,一个库对应两个属性表文件,分别对应:vs2019的debug模式和release模式,例如:本文中OpenCV创建了这两种。而TensorRT和CUDA只需要创建一种属性表(适用以上两种模式)。

2.3.1 创建OpenCV属性表

创建opencv库debug属性表:

step1:基于VS2019随便新建一个C++项目,如下图,项目设置为Debug、X64模式 step2:如下图,选择:[属性窗口] -> [右击Debug|x64] -> [添加新项目属性表] step3:文件命名为:OpenCV4.5.5_DebugX64.props -> [添加]编辑属性表:[如下图:双击属性表] step4:如下图,选择:[通用属性] -> [VC++目录] -> [包含目录] -> [编辑] step5:如下图,将两个OpenCV两个头文件目录拷贝进去 -> [确认] step6:选择:[通用属性] -> [VC++目录] -> [库目录] -> [编辑] -> 将路径:"D:\ThirdParty\opencv4.5.5\build\x64\vc15\lib"拷贝进去 -> [确认]step7:选择:[通用属性] -> [链接器] -> [输入] -> [附加依赖项] -> 将文件名"opencv_world455d.lib"拷贝进去->[确认] 小结:

到这里,opencv库debug属性表制作完成,release属性表和上述流程一样,唯一区别在于,如下图,项目切换到Release x64模式,新建OpenCV4.5.5_ReleaseX64属性表,然后在step7中,将文件名修改为:“opencv_world455.lib” 请记住,制作属性表就3个步骤:拷贝include路径拷贝lib路径,外加设置dll到系统环境变量拷贝lib文件名称2.3.2 创建TensorRT属性表

右击Debug|x64 or 右击Release|x64新建属性表,重命名为:TensorRT8.4.2.4_X64,

# include路径F:\ThirdParty\TensorRT-8.4.2.4\includeF:\ThirdParty\TensorRT-8.4.2.4\samples\commonF:\ThirdParty\TensorRT-8.4.2.4\samples\common\windows# lib路径F:\ThirdParty\TensorRT-8.4.2.4\lib# lib文件名称(for release& debug)nvinfer.libnvinfer_plugin.libnvonnxparser.libnvparsers.lib

依照上一节3个步骤:

step1:选择:[通用属性] -> [VC++目录] -> [包含目录] -> [编辑] -> 把上述3个include路径拷贝进去step2:选择:[通用属性] -> [VC++目录] -> [库目录] -> [编辑] -> 把上述lib路径拷贝进去step3:选择:[通用属性] -> [链接器] -> [输入] -> [附加依赖项] -> [编辑] -> 将上述lib文件名称拷贝进去->[确认] 最后,修改tensorrt属性表:[通用属性] -> [C/C++] -> [预处理器] -> [预处理器定义] -> 添加指令:_CRT_SECURE_NO_WARNINGS -> [确认]2.3.3 创建CUDA属性表

CUDA属性表直接白嫖官方,在路径:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\extras\visual_studio_integration\MSBuildExtensions\CUDA 11.2.props

最后,我们应该有了如下属性表文件: 其中,cuda 和tensorrt的属性表同时兼容release x64 和debug x64,你再新建TensorRT-Alpha中yolov8 yolov7 yolov6 等项目后,只需要把上述提前做好的属性表引入到工程就行了,当然项目还需要进行简单设置(设置NVCC,避免tensorrt的坑),在后文提到。属性表做到了一次新建,到处使用。

三、YOLOv8模型部署

Windows10环境安装YOLOv8,参考我的另一篇《Win10环境下yolov8快速配置与测试》:https://blog.csdn.net/m0_72734364/article/details/128815530

3.1 获取YOLOv8onnx文件

直接在网盘下载 weiyun or google driver 或者使用如下命令导出onnx:

# 🔥 yolov8 官方仓库: https://github.com/ultralytics/ultralytics# 🔥 yolov8 官方教程: https://docs.ultralytics.com/quickstart/# 🚀TensorRT-Alpha will be updated synchronously as soon as possible!# 安装 yolov8conda create -n yolov8 python==3.8 -yconda activate yolov8pip install ultralytics==8.0.5pip install onnx==1.12.0# 下载官方权重(".pt" file)https://github.com/ultralytics/assets/releases/download/v0.0.0/yolov8n.pthttps://github.com/ultralytics/assets/releases/download/v0.0.0/yolov8s.pthttps://github.com/ultralytics/assets/releases/download/v0.0.0/yolov8m.pthttps://github.com/ultralytics/assets/releases/download/v0.0.0/yolov8l.pthttps://github.com/ultralytics/assets/releases/download/v0.0.0/yolov8x.pthttps://github.com/ultralytics/assets/releases/download/v0.0.0/yolov8x6.pt

导出 onnx:

# 640yolo mode=export model=yolov8n.pt format=onnx dynamic=True #simplify=Trueyolo mode=export model=yolov8s.pt format=onnx dynamic=True #simplify=Trueyolo mode=export model=yolov8m.pt format=onnx dynamic=True #simplify=Trueyolo mode=export model=yolov8l.pt format=onnx dynamic=True #simplify=Trueyolo mode=export model=yolov8x.pt format=onnx dynamic=True #simplify=True# 1280yolo mode=export model=yolov8x6.pt format=onnx dynamic=True #simplify=True3.2 编译 onnx# trtexec.exe在路径:F:\ThirdParty\TensorRT-8.4.2.4\bin# 640../../../../TensorRT-8.4.2.4/bin/trtexec.exe --onnx=yolov8n.onnx --saveEngine=yolov8n.trt --buildOnly --minShapes=images:1x3x640x640 --optShapes=images:4x3x640x640 --maxShapes=images:8x3x640x640../../../../TensorRT-8.4.2.4/bin/trtexec.exe --onnx=yolov8s.onnx --saveEngine=yolov8s.trt --buildOnly --minShapes=images:1x3x640x640 --optShapes=images:4x3x640x640 --maxShapes=images:8x3x640x640../../../../TensorRT-8.4.2.4/bin/trtexec.exe --onnx=yolov8m.onnx --saveEngine=yolov8m.trt --buildOnly --minShapes=images:1x3x640x640 --optShapes=images:4x3x640x640 --maxShapes=images:8x3x640x640../../../../TensorRT-8.4.2.4/bin/trtexec.exe --onnx=yolov8l.onnx --saveEngine=yolov8l.trt --buildOnly --minShapes=images:1x3x640x640 --optShapes=images:4x3x640x640 --maxShapes=images:8x3x640x640../../../../TensorRT-8.4.2.4/bin/trtexec.exe --onnx=yolov8x.onnx --saveEngine=yolov8x.trt --buildOnly --minShapes=images:1x3x640x640 --optShapes=images:4x3x640x640 --maxShapes=images:8x3x640x640# 1280../../../../TensorRT-8.4.2.4/bin/trtexec.exe --onnx=yolov8x6.onnx --saveEngine=yolov8x6.trt --buildOnly --minShapes=images:1x3x1280x1280 --optShapes=images:4x3x1280x1280 --maxShapes=images:8x3x1280x1280

你将会的到例如:yolov8n.trt、yolov8s.trt、yolov8m.trt等文件。

3.3 编译运行

3.3.1 新建、设置项目 下载TensorRT-Alpha仓库:

git clone https://github.com/FeiYull/tensorrt-alpha新建yolov8 C++项目:参考B站视频【提示:从0分34秒开始,演示如何设置NVCC编译,如何避免tensorrt在win环境的坑】: yolov8 tensorrt 实战之先导 小结: 后续创建TensorRT-Alpha中YOLOv7、 YOLOv6等工程之后,只需要将上文中的属性表添加到工程,然后按照《yolov8 tensorrt 实战之先导》提到的设置工程就OK。 这篇教程太详细了,这年头,好像很少有人愿意免费给出这么诚意的教程。

3.3.2 编译运行 上面视频在vs2019中设置命令行参数,您也可以在CMD命令行上运行程序,如下:

# 下面参数解释# --show 表示可视化结果# --savePath 表示保存,默认保存在build目录# --savePath=../ 保存在上一级目录## 640# 推理图片./app_yolov8.exe --model=../../data/yolov8/yolov8n.trt --size=640 --batch_size=1 --img=../../data/6406407.jpg --show --savePath./app_yolov8.exe --model=../../data/yolov8/yolov8n.trt --size=640 --batch_size=8 --video=../../data/people.mp4 --show --savePath# 推理视频./app_yolov8.exe --model=../../data/yolov8/yolov8n.trt --size=640 --batch_size=8 --video=../../data/people.mp4 --show --savePath=../# 在线推理相机视频./app_yolov8.exe --model=../../data/yolov8/yolov8n.trt --size=640 --batch_size=2 --cam_id=0 --show## 1280# infer camera./app_yolov8.exe --model=../../data/yolov8/yolov8x6.trt --size=1280 --batch_size=2 --cam_id=0 --show

我的B站所有视频都在WIN10环境运行,https://space.bilibili.com/2028719613

yolov8 tensorrt cuda模型推理加速部署TensorRT-Alpha《ski facility》

yolov8 tensorrt cuda模型推理加速部署TensorRT-Alpha《NewYork-Stree》

yolov7 tensorrt cuda模型推理加速部署TensorRT-Alpha《Korea-Night》

四、参考

https://github.com/FeiYull/TensorRT-Alpha

附录

一位热心小伙做的,他好努力,前几天经常半夜2点、3点给我留言,太卷了,奋斗精神值得学习。

https://www.bilibili.com/video/BV1SM411i7km/?spm_id_from=333.999.0.0&vd_source=a96c9c3f099f4167807291a34fd50fd5

本文链接地址:https://www.jiuchutong.com/zhishi/298412.html 转载请保留说明!

上一篇:vue项目关于:Error Cannot find module ‘xxx\bin\vue-cli-service.js‘的解决方案(vue.$el)

下一篇:Python 基础(十二):字典(python基础100例)

  • 个体工商户个人经营所得税优惠政策
  • 报考中级会计师怎么报名
  • 年金是否一定是每年发生一次
  • 内含报酬率与必要报酬率相等
  • 运输货车折旧计算公式
  • 小微企业一般要交什么费用2019
  • 财务报表分析五种方法
  • 什么时候确认应收股利
  • 什么时候库存商品什么时候主营业务收入
  • 发票服务名称都有什么
  • 表外负债和表内负债对比
  • 电子承兑汇票如何拆小
  • 保修期内免费维修
  • 赠送样品视同销售增值税该怎么做账务处理呢?
  • 证券清算款是什么科目
  • 月末结转所有收入类账户
  • 固定资产进项税额
  • 广告位的费用
  • 开具发票时,哪些备注事项需要被重视?
  • 公司收境外汇款
  • 增值税是什么鬼
  • 质保金付款时怎么付
  • 进口技术服务需要向海关备案吗
  • 发票和款未付可以抵扣吗
  • 280元航天使用费多少钱
  • 怎么找回被册的软件
  • 没有开工没有收入用书面语言表达
  • 公司购买空调计入什么费用
  • 若依框架登录后跳转到指定页面
  • antd怎么用
  • 跨年的定额发票可以用吗
  • 库存盘点差异会计分录
  • 酒店的原材料和包装
  • 谷歌浏览器如何设置主页为默认页
  • php引用文件的方法
  • 宝塔面板使用教程
  • 市盈率和市净率多少比较合适
  • PyTorch深度学习实战 | 基于ResNet的人脸关键点检测
  • 购入苗木进项税的会计分录
  • 季节性用工法律规定
  • 资产处置费用是资产类会计科目吗
  • 企业应设置的账簿包括什么
  • 客户要发票加收怎么办
  • 固定资产的财务业绩是什么意思啊
  • 主营业务收入和销售费用的区别
  • 汽车维修企业怎么认定小微企业
  • 本年度企业所得税怎么算
  • 收益性支出包括哪些内容
  • 专家评审费如何入账
  • 进出口贸易公司取名字大全
  • 增值税进项税转出有哪些
  • 个体工商户要进行汇算清缴吗
  • 国外佣金算什么费用比较好
  • 开出银行承兑汇票一张用于支付材料采购款
  • 材料自产自销的会计科目
  • 收到其他公司款项会计分录
  • 总分包模式和总承包模式
  • 如何提取坏账准备
  • 长期应收款是否计提坏账准备
  • 企业因固定资产破产
  • ubuntu16.04.1下 mysql安装和卸载图文教程
  • win10蓝屏怎么修复系统
  • windows XP+Fedora 8+solaris 11三系统安装攻略
  • OS X Yosemite系统下载失败怎么办?OS X 10.10下载错误解决方法
  • 特俗字符
  • qtaet2s.exe - qtaet2s是什么进程 有什么用
  • windows 8.1 (multiple editions)
  • win10系统应用更新
  • Windows下的写字板功能是
  • perl数组元素个数
  • shell脚本mysql
  • 浅谈幼儿良好行为的培养论文
  • node.js操作mssql
  • unity3drpg游戏
  • android 显示图片
  • 脚本 python
  • 房产税从价计征的计税依据
  • 物业收电费有什么猫腻
  • 税务局查帐流程
  • 留抵税额退税政策2023
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设