位置: IT常识 - 正文

cuda常见报错(cuda completed with errors)

编辑:rootadmin
cuda常见报错 RuntimeError: CUDA error: device-side assert triggered

推荐整理分享cuda常见报错(cuda completed with errors),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:cuda available false,cuda available false,cuda error unspecified,cuda is not available,cuda error in cudaprogram,cuda available false,cuda.is_available false,cuda completed with errors,内容如对您有帮助,希望把文章链接给更多的朋友!

CUDA kernel errors might be asynchronously reported at some other API call, so the stacktrace below might be incorrect. For debugging consider passing CUDA_LAUNCH_BLOCKING=1. /pytorch/aten/src/ATen/native/cuda/IndexKernel.cu:93:  operator(): block: [0,0,0], thread: [70,0,0]  Assertion index >= -sizes[i] && index < sizes[i] && "index out of bounds" failed.

Assertion `index >= -sizes[i] && index < sizes[i] && "index out of bounds"

数据超出了边界。在给出label的时候,我的数据集在某个标签上会给进去一个小于零或者大于类别数的一个标签,大白话就是设定了模型分类数量为4,但是数据集中有大于4个类别则会报错,少于4个是不会报错。

解决方法:修改预设的类别数量,class_map里面预先写好的类别个数和实际的数据集里面的标签种类和个数不同。可以要修改class_map或者修改数据集。

device-side assert triggered,CUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.

/pytorch/aten/src/ATen/native/cuda/IndexKernel.cu:93: operator(): block: [0,0,0], thread: [28,0,0] Assertion index >= -sizes[i] && index < sizes[i] && "index out of bounds" failed.

标签索引不正确,即标签编号大于定义标签,定义crf层的时候标签的类别数和yaml中的类别数不同,要么修改标签文件,要么修改层的类别数量定义

TypeError: can't convert cuda:0 device type tensor to numpy. Use Tensor.cpu() to copy the tensor to host memory first.cuda常见报错(cuda completed with errors)

原因:

a = str(trues_cls.detach().numpy()[0]) #这样是错误的numpy不能读取CUDA tensor 需要将它转化为 CPU tensor。

解决方法:

CUDA tensor格式的数据改成numpy时,需要先将其转换成cpu float-tensor随后再转到numpy格式。a= str(trues_cls.detach().cpu().numpy()[0])  # 这样是正确的​​​​​​​# detach(): 返回一个新的Tensor,但返回的结果是没有梯度的。 # cpu():把gpu上的数据转到cpu上。 # numpy():将tensor格式转为numpyRuntimeError: CUDA error: invalid device ordinal

CUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.

For debugging consider passing CUDA_LAUNCH_BLOCKING=1.

输入的显卡卡号错了,可以切换显卡号的数字尝试

不同的设备同样参数的情况下训练结果不一致的问题

原因:dropout层的随机性,当输入dropout层的数据维度大于57346时,从第57347位开始不同显卡的结果会不一样,原因是不同显卡的数据采样方法在第57346位后存在差别。

解决方法:手动构造一个由randn实现的dropout层,可以实现跨机结果一致

伯努利分布,使用torch.tensor,与cuda有关,randn和数字有关

服务器存在两个卡,但只能用其中一张卡跑程序

原因:环境使用了export,导致只有一个 GPU可见 (GPU:0),而程序中使用 GPUs:1。

输入export CUDA_VISIBLE_DEVICES = '0,1',让设备变为两个,方便在环境中随意切换

本文链接地址:https://www.jiuchutong.com/zhishi/285053.html 转载请保留说明!

上一篇:vue项目pc端和移动端适配(vue移动和pc两套代码)

下一篇:HTML a 标签详解(html中a标签的作用)

  • 新闻稿发布怎样能发到手机客户端?(新闻稿方法)

    新闻稿发布怎样能发到手机客户端?(新闻稿方法)

  • steam删除好友对方知道吗(steam删除好友对方列表还有吗)

    steam删除好友对方知道吗(steam删除好友对方列表还有吗)

  • soul提示密友悄悄上线(soul显示密友啥意思)

    soul提示密友悄悄上线(soul显示密友啥意思)

  • 华为mate30pro耳机孔在哪(华为mate30pro耳机插上没反应)

    华为mate30pro耳机孔在哪(华为mate30pro耳机插上没反应)

  • 淘宝红包省钱卡怎么用(开通淘宝红包省钱卡)

    淘宝红包省钱卡怎么用(开通淘宝红包省钱卡)

  • 微信私信是什么意思(微信新功能私信)

    微信私信是什么意思(微信新功能私信)

  • 小米一直开机关机循环怎么办(小米一直不停开关机)

    小米一直开机关机循环怎么办(小米一直不停开关机)

  • 小米一直开机关机循环怎么办(小米一直开关机怎么办)

    小米一直开机关机循环怎么办(小米一直开关机怎么办)

  • 腾讯会议切屏会看到吗(腾讯会议切屏会不会被发现)

    腾讯会议切屏会看到吗(腾讯会议切屏会不会被发现)

  • 华为p40关机键在哪里(华为p40关机键设置)

    华为p40关机键在哪里(华为p40关机键设置)

  • 华为喇叭一会大一会小(华为喇叭声音忽大忽小)

    华为喇叭一会大一会小(华为喇叭声音忽大忽小)

  • 手机屏幕出现一条绿色的线(手机屏幕出现一根绿线能修好吗)

    手机屏幕出现一条绿色的线(手机屏幕出现一根绿线能修好吗)

  • pe进不去是什么原因(pe进不去)

    pe进不去是什么原因(pe进不去)

  • 如何撤回抖音发布的视频(如何撤回抖音发的语音邀请聊天记录)

    如何撤回抖音发布的视频(如何撤回抖音发的语音邀请聊天记录)

  • 朋友圈怎么全部清空(朋友圈怎么全部清空别人发的)

    朋友圈怎么全部清空(朋友圈怎么全部清空别人发的)

  • 路由器连接猫网线接法(路由器连接猫网络灯一直闪)

    路由器连接猫网线接法(路由器连接猫网络灯一直闪)

  • ipadair能插内存卡吗(ipadair能装内存卡吗)

    ipadair能插内存卡吗(ipadair能装内存卡吗)

  • 云票是什么(云票平台)

    云票是什么(云票平台)

  • 苹果8plus充电多久能充满(苹果8plus充电多少w)

    苹果8plus充电多久能充满(苹果8plus充电多少w)

  • 小米9自动开关机怎么设置(小米9自动开关机怎么设置 视频)

    小米9自动开关机怎么设置(小米9自动开关机怎么设置 视频)

  • 微信活动抽奖小程序是真的吗(微信活动抽奖小程序幸运夺宝)

    微信活动抽奖小程序是真的吗(微信活动抽奖小程序幸运夺宝)

  • 支付宝收款码异常怎么恢复(支付宝收款码异地收款风控)

    支付宝收款码异常怎么恢复(支付宝收款码异地收款风控)

  • word邀请函日期怎么自动更新(word将日期调整为可以根据邀请函生成日期自动更新)

    word邀请函日期怎么自动更新(word将日期调整为可以根据邀请函生成日期自动更新)

  • r17录屏在哪里设置(oppor17录屏设置在哪)

    r17录屏在哪里设置(oppor17录屏设置在哪)

  • 三星手机如何下载app(三星手机如何下载微信)

    三星手机如何下载app(三星手机如何下载微信)

  • vue动态路由添加,vue-router的addRoute方法实现权限控制,添加根路由和子路由(vue 动态添加路由)

    vue动态路由添加,vue-router的addRoute方法实现权限控制,添加根路由和子路由(vue 动态添加路由)

  • 无需公网IP,远程连接SQL Server数据库【内网穿透】(没有公网ip如何实现外网访问路由器)

    无需公网IP,远程连接SQL Server数据库【内网穿透】(没有公网ip如何实现外网访问路由器)

  • 停车费手撕票如何填写申报表
  • 特别关税是多少人民币
  • 自己申报个人所得税需要补缴,必须自己申报自己补缴吗
  • 存货造成的损失
  • 购进货物进项不予抵扣
  • 押金可以抵扣吗
  • 财务报表中预收账款的数据是怎么来的
  • 核定征收未分配利润分红分录
  • 工程款填入申报表应税服务还是应税劳务一栏?
  • 分包发票怎么开对方可以差额纳税
  • 未退还的保证金怎么处理
  • 商场 折扣
  • 固定资产折旧年限的最新规定2023
  • 资产总额是资产负债表中的哪个数
  • 金蝶迷你版年结账套怎么结转下年
  • 其他应收款注销时处理
  • 企业收到政府扶贫资金补助及运用补助金怎么做账
  • cpu天梯图2022最新排行榜
  • 怎么写会计凭证
  • 实收资本要求
  • 企业并购效益
  • 局域网解决方案
  • php 钩子
  • pc程序是什么
  • 股份有限公司变更法人的流程
  • 事业单位会计专业知识考什么
  • php 强类型
  • 固定资产折旧怎么做账务处理
  • 抵免法的缺点主要有以下几点
  • 我国关税税则设有
  • 车辆购置税税收缴款书
  • vue项目运行报错
  • php正则函数内容匹配
  • 三公经费包括哪些支出
  • php获取post请求参数
  • 使用php进行mysql数据库编程的基本步骤
  • chatb
  • 网络请求失败什么意思
  • 人工智能导论论文2000字
  • vuepress plugin
  • 货已入库进项发票未到怎么办
  • 社保基数填错了 多扣多钱可以退款吗
  • 银行日记账错误更正案例
  • 应收账款提坏账准备的方法
  • Linux下MySQL卸载和安装图文教程
  • mysql数据库高可用方案
  • 最好最实用的织毛线
  • 技术转移转化是干什么的
  • 新政府会计制度下,属于资产类科目的是
  • 销售费用变动率异常
  • 主营业务成本可以设明细科目吗
  • 残保基金什么时候申报
  • 纳税总额怎么算
  • 承兑汇票贴现的利率
  • SQL中DATEADD和DATEDIFF的用法示例介绍
  • 贷方账户日累计金额超限什么意思
  • 机会成本的特点有()
  • 留抵抵欠税附加税需要交嘛
  • 公司买的吃的计入什么科目
  • 优秀员工奖金领取表模板
  • 总公司可以给子公司开票吗
  • 税控盘的主要功能
  • “制造费用”账户如何设置明细账?
  • mysql安装不成功怎么办
  • slpv24s.exe - slpv24s是什么进程
  • linux bin和sbin
  • windows xp.
  • linux新增lv
  • win8自带杀毒软件 关闭
  • linuxone
  • HTML文档中的头部(head)内容一般包含什么
  • shell按行读取文件存入数组
  • js实现多继承
  • 南京电子税务局咨询电话
  • 地域税收收入增长原因
  • 个体诊所可以申请医保报销吗
  • 北京鼓楼医院网上挂号app
  • 工业厂房房产税什么时候开始征收
  • 开健身会所国家有补贴吗
  • 预到船舶是什么
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设