位置: IT常识 - 正文

玄学错误:RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED 解决方案——cuDNN 卸载并重装(玄学2021)

编辑:rootadmin
玄学错误:RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED 解决方案——cuDNN 卸载并重装 前言

推荐整理分享玄学错误:RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED 解决方案——cuDNN 卸载并重装(玄学2021),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:玄学2021,玄学警告,玄学合集,玄学失败,玄学解析,玄学合集,玄学解析,玄学警告,内容如对您有帮助,希望把文章链接给更多的朋友!

不得不说环境是一个非常玄学的东西,距离上次成功在 FB15k-237 数据集上跑 convE 模型没多久

ConvE,知识图谱嵌入(KGE)论文复现(Ubuntu 20.04)_Starprog_UESTC_Ax的博客-CSDN博客_conve 知识图谱ConvE(KGE模型)—论文复现(Ubuntu 20.04)(2022.03.07)https://angxiao.blog.csdn.net/article/details/123315377今天又在更换自己的数据集重跑 convE 模型,很神奇的报错:

RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED

在跑两次模型之间这段时间,我并没有动我的 GPU 环境,包括内核都用的之前的:

内核版本:5.13.0-35-generic

uname -a

另外,用这个环境跑 OpenKE【这 个工具包不含convE 】 也都没问题

网上搜了这个错误,有的说是指定显卡号,大多说是 cuda 和 cuDNN 版本不匹配的问题,让安装对应版本的 cuDNN。由于我之前装的时候,cuda 和 cuDNN 版本是匹配的【是否匹配,在 cuDNN 官网 可查】,所以我将 cuDNN 卸载重装,最终成功,把今天排错解决过程放在下边,大家有需要可以参考

一、检查是否有可用的显卡

输入 python 进入环境,运行命令:

import torchprint(torch.cuda.device_count()) #可用GPU数量

如果 没有可用显卡 或 GPU 环境配置有误,就会输出 0,在模型运行中,就会报以下错误:

cuda runtime error (38) : no CUDA-capable device is detected

我的莫名其妙重启解决了这个错误【也可以通过开机的高级选项,换个内核版本看看】,输出 0 这种情况每台机器不一样,详细原因可以百度对应解决,多说无益...

如果输出大于等于 2,前言部分所提错误可能是由于没有指定显卡号造成的,可以在模型代码前加入一行:

os.environ['CUDA_VISIBLE_DEVICES'] = '0'

由于我的输出为 1,错误应该不在这一节 

二、检查 cuda 版本 和 cuDNN 版本

① 检查 cuda 版本

查询当前驱动支持的最高版本:

nvidia-smi

查询目前安装的 cuda 版本:

nvcc -V

也可以通过如下命令,看到更为详细的信息,包括与之 communicate 的驱动:

cat /usr/local/cuda/cuda.json玄学错误:RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED 解决方案——cuDNN 卸载并重装(玄学2021)

②  检查 cuDNN 版本

有 cudnn.h 文件但无输出,版本未知,理论上,我之前安装的 v 8.3.0,不会去傻乎乎动这个库的

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2三、卸载并重新安装 cuDNN 

① 卸载 cuDNN v 8.3.0

查找出现位置:

注意按照下图顺序卸载【含 2004 的那项那个不卸】:

② 安装 cuDNN v 8.3.0

重复内容,不再赘述,参考以下博文:

(15条消息) Ubuntu 20.04 系统(双系统环境下)中深度学习环境配置(Pytorch + GPU)_Starprog_UESTC_Ax的博客-CSDN博客_ubuntu子系统https://angxiao.blog.csdn.net/article/details/123196056不过在验证是否安装成功阶段,报了个小错:

AttributeError: module 'torch.jit' has no attribute 'unused'

原因:torch 和 torchvision 版本不匹配

解决:

安装 torch 1.4.0 版本:

安装 torchvision 0.5.0 版本

再次验证,成功:

四、重跑模型 convEpython wrangle_KG.py BACUDA_VISIBLE_DEVICES=0 python main.py --model conve --data BA \ --input-drop 0.2 --hidden-drop 0.3 --feat-drop 0.2 \ --lr 0.003 --preprocess

 成功执行:

附录

换源加速安装

如果下载速度很慢,在原来安装语句上添加 -i 和 如下任一镜像地址即可切换国内服务器:

阿里云 http://mirrors.aliyun.com/pypi/simple/中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/豆瓣(douban) http://pypi.douban.com/simple/清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/中国科学技术大学 http://pypi.mirrors.ustc.edu.cn/simple/
本文链接地址:https://www.jiuchutong.com/zhishi/296168.html 转载请保留说明!

上一篇:共轭梯度法(Conjugate Gradients)(1)(共轭梯度法matlab代码)

下一篇:Android 10.0 framework中关于Activitity的生命周期的源码讲解

  • iqoo8怎么取消录制王者荣耀时的弹窗(iqoo自动录音功能)

    iqoo8怎么取消录制王者荣耀时的弹窗(iqoo自动录音功能)

  • 青年大学习怎么打开

    青年大学习怎么打开

  • 惠普笔记本摄像头在哪里打开(惠普笔记本摄像头用不了怎么回事)

    惠普笔记本摄像头在哪里打开(惠普笔记本摄像头用不了怎么回事)

  • 金立s10怎么插双卡(金立s10怎么插双卡视频)

    金立s10怎么插双卡(金立s10怎么插双卡视频)

  • 电脑显示器接口哪个好(电脑显示器接口叫什么)

    电脑显示器接口哪个好(电脑显示器接口叫什么)

  • ios微信把地区改任意文字(ios微信地区修改神器2020)

    ios微信把地区改任意文字(ios微信地区修改神器2020)

  • 京东怎么定位别的城市(京东怎样定位到别的地方)

    京东怎么定位别的城市(京东怎样定位到别的地方)

  • 腾讯课堂分屏算退出吗(腾讯课堂分屏会被发现吗?)

    腾讯课堂分屏算退出吗(腾讯课堂分屏会被发现吗?)

  • 为什么蓝牙搜索不到etc设备(为什么蓝牙搜索不到小米手环)

    为什么蓝牙搜索不到etc设备(为什么蓝牙搜索不到小米手环)

  • 拼多多上如何辨识真货(拼多多如何辨别官方旗舰店)

    拼多多上如何辨识真货(拼多多如何辨别官方旗舰店)

  • 饿了吗取消订单会退款吗(饿了么取消订单怎么申诉才能成功)

    饿了吗取消订单会退款吗(饿了么取消订单怎么申诉才能成功)

  • 未接通是对方拒接了吗(对方未接听通话)

    未接通是对方拒接了吗(对方未接听通话)

  • internal server error什么意思(Internal Server Error王者)

    internal server error什么意思(Internal Server Error王者)

  • ps怎么建立选区(ps怎么建立选区快捷键)

    ps怎么建立选区(ps怎么建立选区快捷键)

  • word2019邮件在哪看(word邮件在哪)

    word2019邮件在哪看(word邮件在哪)

  • oppo手机粘贴板在哪里打开(OPPO手机粘贴板怎么设置多个)

    oppo手机粘贴板在哪里打开(OPPO手机粘贴板怎么设置多个)

  • 荣耀20怎么关后台(荣耀20shd怎么关)

    荣耀20怎么关后台(荣耀20shd怎么关)

  • 微博怎么让别人看不到我的动态(微博怎么让别人搜不到我)

    微博怎么让别人看不到我的动态(微博怎么让别人搜不到我)

  • ai技术是用什么(ai技术是什么现在主要应用领域有哪些)

    ai技术是用什么(ai技术是什么现在主要应用领域有哪些)

  • 竖的时间改为横的怎么改(怎样把竖向的时间和改为横向的)

    竖的时间改为横的怎么改(怎样把竖向的时间和改为横向的)

  • pop服务器使用的端口号是(pop服务器是什么)

    pop服务器使用的端口号是(pop服务器是什么)

  • 火山怎么取消实名认证(火山怎么取消年龄设置)

    火山怎么取消实名认证(火山怎么取消年龄设置)

  • 苹果手机自带便签在哪(苹果手机自带便携小空调吗)

    苹果手机自带便签在哪(苹果手机自带便携小空调吗)

  • 米读怎么删除阅读记录(米读缓存的章节怎么删除)

    米读怎么删除阅读记录(米读缓存的章节怎么删除)

  • 实现瀑布流布局的四种方法(瀑布流实现方式)

    实现瀑布流布局的四种方法(瀑布流实现方式)

  • Dedecms移动端网站手机网站的搭建(dedecms建站)

    Dedecms移动端网站手机网站的搭建(dedecms建站)

  • 未开票收入如何填写增值税申报表
  • 企业按照行业分类为
  • 以件数为印花税计税依据的有哪些
  • 买车装具
  • 支付员工费用报销账务处理
  • 重新建账 和之前数据差的多
  • 用库存现金支付职工医药费用69元,会计人员
  • 合同能源管理项目账务处理
  • 财政拨付的研发费用
  • 材料验收入库款项尚未支付
  • 季节性停工折旧吗
  • 增值税税率调整时间17变16
  • 长期股权投资收到红利会计处理
  • 委托加工的材料计入什么科目
  • 银行收付款通知短信
  • 企业生产成本核算的一般程序为
  • 自行建造固定资产的计税基础
  • 生产企业报关单金额大于发票金额
  • 民办非企业单位是私立还是公立
  • 可以给行政事业单位开增值税专用发票吗
  • 发票密码区出来了一些
  • 年初未分配利润在借方表示什么
  • 对方发票丢失开什么证明
  • 个人借款利息收入增值税税率
  • 出口退税免退税办法
  • 如何在excel中制作柱状图
  • 王者荣耀中如何隐藏贵族标志
  • 车辆理赔款计入什么科目
  • 双网卡冲突会发生什么现象
  • php时间戳相减
  • redhat无法进入图形界面
  • wordpress抓取网页
  • asldrsrv.exe
  • php限制登录次数
  • npp怎么安装
  • 收外汇怎么做账报税
  • 金银首饰消费税计税依据
  • php中面向对象
  • 小型企业资产负债表
  • thinkphp框架介绍
  • php ajax 实现
  • node教程
  • bp-神经网络
  • php socket_create
  • php实现将base64格式图片保存在指定目录的方法
  • php7 数组
  • 应纳税所得额调整金额怎么算
  • Packaging a Qt application
  • 固定资产已提完折旧报废后如何处理
  • 在正确使用和正常维护的条件下
  • 个人销售商品交什么税
  • 民间非营利组织财务管理制度
  • 汇算清缴前跨年调账怎么调
  • 印花税计入什么会计分录
  • 定额发票累计领取怎么算
  • sql语句连接方式
  • soft version
  • vmware安装macos10.15
  • main.exe是什么意思
  • win101903更新安装失败
  • win 7电脑音箱没有声音
  • javascript标准
  • cocos2djs
  • 汤姆猫arcode
  • Android 开源项目集合
  • 安卓专业图片处理软件
  • 解决胃胀气最快方法
  • unity3d脚本执行顺序
  • Unity3D游戏开发(第2版)pdf
  • 批处理自动关闭
  • js对象常用方法
  • shell脚本总结
  • unity ui
  • ajax+node+request爬取网络图片的实例(宅男福利)
  • unity3d入门视频教程
  • 安卓模拟器比手机快吗
  • javascript的for循环
  • jQuery Easyui Tabs扩展根据自定义属性打开页签
  • js触发select下拉列表
  • 进口肉的税率是多少
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设