位置: IT常识 - 正文

玄学错误:RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED 解决方案——cuDNN 卸载并重装(玄学2021)

编辑:rootadmin
玄学错误:RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED 解决方案——cuDNN 卸载并重装 前言

推荐整理分享玄学错误:RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED 解决方案——cuDNN 卸载并重装(玄学2021),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:玄学2021,玄学警告,玄学合集,玄学失败,玄学解析,玄学合集,玄学解析,玄学警告,内容如对您有帮助,希望把文章链接给更多的朋友!

不得不说环境是一个非常玄学的东西,距离上次成功在 FB15k-237 数据集上跑 convE 模型没多久

ConvE,知识图谱嵌入(KGE)论文复现(Ubuntu 20.04)_Starprog_UESTC_Ax的博客-CSDN博客_conve 知识图谱ConvE(KGE模型)—论文复现(Ubuntu 20.04)(2022.03.07)https://angxiao.blog.csdn.net/article/details/123315377今天又在更换自己的数据集重跑 convE 模型,很神奇的报错:

RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED

在跑两次模型之间这段时间,我并没有动我的 GPU 环境,包括内核都用的之前的:

内核版本:5.13.0-35-generic

uname -a

另外,用这个环境跑 OpenKE【这 个工具包不含convE 】 也都没问题

网上搜了这个错误,有的说是指定显卡号,大多说是 cuda 和 cuDNN 版本不匹配的问题,让安装对应版本的 cuDNN。由于我之前装的时候,cuda 和 cuDNN 版本是匹配的【是否匹配,在 cuDNN 官网 可查】,所以我将 cuDNN 卸载重装,最终成功,把今天排错解决过程放在下边,大家有需要可以参考

一、检查是否有可用的显卡

输入 python 进入环境,运行命令:

import torchprint(torch.cuda.device_count()) #可用GPU数量

如果 没有可用显卡 或 GPU 环境配置有误,就会输出 0,在模型运行中,就会报以下错误:

cuda runtime error (38) : no CUDA-capable device is detected

我的莫名其妙重启解决了这个错误【也可以通过开机的高级选项,换个内核版本看看】,输出 0 这种情况每台机器不一样,详细原因可以百度对应解决,多说无益...

如果输出大于等于 2,前言部分所提错误可能是由于没有指定显卡号造成的,可以在模型代码前加入一行:

os.environ['CUDA_VISIBLE_DEVICES'] = '0'

由于我的输出为 1,错误应该不在这一节 

二、检查 cuda 版本 和 cuDNN 版本

① 检查 cuda 版本

查询当前驱动支持的最高版本:

nvidia-smi

查询目前安装的 cuda 版本:

nvcc -V

也可以通过如下命令,看到更为详细的信息,包括与之 communicate 的驱动:

cat /usr/local/cuda/cuda.json玄学错误:RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED 解决方案——cuDNN 卸载并重装(玄学2021)

②  检查 cuDNN 版本

有 cudnn.h 文件但无输出,版本未知,理论上,我之前安装的 v 8.3.0,不会去傻乎乎动这个库的

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2三、卸载并重新安装 cuDNN 

① 卸载 cuDNN v 8.3.0

查找出现位置:

注意按照下图顺序卸载【含 2004 的那项那个不卸】:

② 安装 cuDNN v 8.3.0

重复内容,不再赘述,参考以下博文:

(15条消息) Ubuntu 20.04 系统(双系统环境下)中深度学习环境配置(Pytorch + GPU)_Starprog_UESTC_Ax的博客-CSDN博客_ubuntu子系统https://angxiao.blog.csdn.net/article/details/123196056不过在验证是否安装成功阶段,报了个小错:

AttributeError: module 'torch.jit' has no attribute 'unused'

原因:torch 和 torchvision 版本不匹配

解决:

安装 torch 1.4.0 版本:

安装 torchvision 0.5.0 版本

再次验证,成功:

四、重跑模型 convEpython wrangle_KG.py BACUDA_VISIBLE_DEVICES=0 python main.py --model conve --data BA \ --input-drop 0.2 --hidden-drop 0.3 --feat-drop 0.2 \ --lr 0.003 --preprocess

 成功执行:

附录

换源加速安装

如果下载速度很慢,在原来安装语句上添加 -i 和 如下任一镜像地址即可切换国内服务器:

阿里云 http://mirrors.aliyun.com/pypi/simple/中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/豆瓣(douban) http://pypi.douban.com/simple/清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/中国科学技术大学 http://pypi.mirrors.ustc.edu.cn/simple/
本文链接地址:https://www.jiuchutong.com/zhishi/296168.html 转载请保留说明!

上一篇:共轭梯度法(Conjugate Gradients)(1)(共轭梯度法matlab代码)

下一篇:Android 10.0 framework中关于Activitity的生命周期的源码讲解

  • 红魔6spro跑分多少

    红魔6spro跑分多少

  • 钉钉班级群怎么改家长身份(钉钉班级群怎么改备注名字)

    钉钉班级群怎么改家长身份(钉钉班级群怎么改备注名字)

  • 微信红包自动领取设置(微信红包自动领取设置vivo)

    微信红包自动领取设置(微信红包自动领取设置vivo)

  • 微信语音通话有辐射吗(微信语音通话有录音备份吗)

    微信语音通话有辐射吗(微信语音通话有录音备份吗)

  • 苹果受信任证书啥意思(苹果受信任证书存储区日期是什么意思)

    苹果受信任证书啥意思(苹果受信任证书存储区日期是什么意思)

  • 快手小店退货有运费险吗(快手小店退货有上门取件吗)

    快手小店退货有运费险吗(快手小店退货有上门取件吗)

  • 华为nova5pro可以开空调吗(华为nova5pro可以无线充电吗)

    华为nova5pro可以开空调吗(华为nova5pro可以无线充电吗)

  • 抖音隐身在线设置在哪(抖音设置了隐身在线后是不是别人看不到我的作品了呢)

    抖音隐身在线设置在哪(抖音设置了隐身在线后是不是别人看不到我的作品了呢)

  • 为什么抖音没有分享箭头(为什么抖音没有微信支付)

    为什么抖音没有分享箭头(为什么抖音没有微信支付)

  • airpods摔坏了能保修吗(airpods摔了一下 能不能保修)

    airpods摔坏了能保修吗(airpods摔了一下 能不能保修)

  • 华为畅享10plus支持快充吗(华为畅享10plus支持5g网络吗)

    华为畅享10plus支持快充吗(华为畅享10plus支持5g网络吗)

  • 苹果拉黑电话怎么恢复(苹果拉黑电话怎么拉黑短信)

    苹果拉黑电话怎么恢复(苹果拉黑电话怎么拉黑短信)

  • 苹果XR在哪更新ios13(苹果xr怎么更新)

    苹果XR在哪更新ios13(苹果xr怎么更新)

  • 怎么用抖音视频做锁屏(怎么用抖音视频的模板)

    怎么用抖音视频做锁屏(怎么用抖音视频的模板)

  • 微信京东怎么取消预约(微信京东怎么取消绑定)

    微信京东怎么取消预约(微信京东怎么取消绑定)

  • 快手举报人会不会被发现(快手举报人会不会被其他人在看到)

    快手举报人会不会被发现(快手举报人会不会被其他人在看到)

  • 快手直播封面怎么更新不了(快手直播封面怎么和直播同步)

    快手直播封面怎么更新不了(快手直播封面怎么和直播同步)

  • 视频发不了朋友圈是怎么回事(视频发不了朋友圈显示正在从icoud备份)

    视频发不了朋友圈是怎么回事(视频发不了朋友圈显示正在从icoud备份)

  • 抖音怎么批量取消点赞(抖音怎么批量取消喜欢的作品视频)

    抖音怎么批量取消点赞(抖音怎么批量取消喜欢的作品视频)

  • rx580series是什么(rx580系列)

    rx580series是什么(rx580系列)

  • 微信运动关闭是虚线吗(微信运动关闭是什么心态)

    微信运动关闭是虚线吗(微信运动关闭是什么心态)

  • 小米9为什么没有耳机(小米9为什么没有声音了)

    小米9为什么没有耳机(小米9为什么没有声音了)

  • macos13支持设备机型详情(macos12支持设备)

    macos13支持设备机型详情(macos12支持设备)

  • 最快的SDHC是什么(sdhc 速度)

    最快的SDHC是什么(sdhc 速度)

  • 出口退税勾选后多久可以申报退税
  • 物流企业信用评级
  • 房地产企业契税税率是多少
  • 保证金抵扣货款分录
  • 待处理产品损益账户的核算内容不包括
  • 特殊销售方式的计税依据
  • 客户方流水号是什么
  • 有没有薪酬
  • 支付现金未给发票怎么做账?
  • 非全日制劳动用工扣税
  • 房产交易差价
  • 一般进口货物的完税价格
  • 装修公司购装修材料入什么科目?
  • 怎么把公司账户的钱转到个人账号
  • bois如何设置启动项
  • 购买所有物品都是可以退货吗
  • 企业内部股权划拨流程
  • 发票来了冲预付账款怎么记账
  • 挂社保不发工资
  • 劳务公司开具劳务费发票
  • 购买预付卡如何记账
  • 司机公里补助用不用交个税
  • 结转损益和结转成本
  • 电脑取消共享文件夹
  • 小米无线路由器internet黄灯
  • 小微企业减免额怎么计算
  • 一般纳税人购进税控收款机抵扣
  • 财务报表的组成部分
  • 成本核算方法主要有哪些
  • 总公司给分公司调货
  • php实现创建微信群聊
  • php浮点数
  • 小规模企业需要交几个点
  • php数组函数有哪些
  • 一般纳税人购买原材料会计分录
  • 固定资产报废如何记账
  • FPGA实现64点IFFT(VHDL)
  • mysql服务开不起来
  • 个税年度汇算清缴总结
  • 增值税发票是记账联还是抵扣联
  • 销售bu是什么意思
  • 转让旧固定资产怎么处理
  • 小企业长期债券投资
  • sql跨服务器查询语句
  • 买一赠一涉及企业所得税的处理
  • 进口化妆品品牌大全
  • 应付职工薪酬的核算内容
  • 零申报企业年报资产状况信息怎么填
  • 运费少给怎么办
  • 现金流量少
  • 售后回租的实际利率怎么计算
  • 没有外币账户可以收外币吗
  • 行政单位经费支出审批权限
  • iis怎么用
  • ubuntu16.04怎么改成中文
  • linux的总结
  • centos开机grub
  • linux使用ssh命令
  • windows2008无法识别usb
  • win7 u盘不显示
  • win7怎么连接耳机蓝牙
  • jquery设置自定义属性
  • win10如何使用命令
  • vue用户权限解决方案
  • 从零开始的基础篇
  • node js官网
  • shader能做什么
  • 引用jquery后没反应
  • javascript下拉列表怎么做
  • android应用程序包下载安装
  • 银行赠送礼品活动方案
  • 浙江国税电子税务局
  • 新疆天山农商银行大额存单2024
  • 纳税信用d级企业保留几年
  • 土地使用税一般谁交
  • 尤溪特产春节礼品
  • 成都市地方税务局官网
  • 税务总局在贯彻落实意见任务分工中
  • 一般纳税人办理退税流程及手续
  • 河北电子税务局怎么使用
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设