当前位置: 首页 > news >正文

服务器 网站建设五站合一网站建设

服务器 网站建设,五站合一网站建设,网站建设时间规划,wordpress 文件分享今天在训练模型的时候突然报了显存不够的问题#xff0c;然后分析了一下#xff0c;找到了解决的办法#xff0c;这里记录一下#xff0c;方便以后查阅。 注#xff1a;以下的解决方案是在模型测试而不是模型训练时出现这个报错的#xff01; RuntimeError: CUDA out of…今天在训练模型的时候突然报了显存不够的问题然后分析了一下找到了解决的办法这里记录一下方便以后查阅。 注以下的解决方案是在模型测试而不是模型训练时出现这个报错的 RuntimeError: CUDA out of memory完整的报错信息 Traceback (most recent call last):File /home/pytorch/LiangXiaohan/MI_Same_limb/Joint_Motion_Decoding/SelfAten_Mixer/main.py, line 420, in modulemain()File /home/pytorch/LiangXiaohan/MI_Same_limb/Joint_Motion_Decoding/SelfAten_Mixer/main.py, line 414, in maintrain_with_cross_validate(training_epochs, kfolds, train_indices, eval_indices, X_train, Y_train, model, losser, optimizer)File /home/pytorch/LiangXiaohan/MI_Same_limb/Joint_Motion_Decoding/SelfAten_Mixer/main.py, line 77, in train_with_cross_validateval_probs model(inputs)File /home/pytorch/anaconda3/envs/pytorch_env/lib/python3.7/site-packages/torch/nn/modules/module.py, line 1130, in _call_implreturn forward_call(*input, **kwargs)File /home/pytorch/LiangXiaohan/MI_Same_limb/Joint_Motion_Decoding/SelfAten_Mixer/model/S_CAMLP_Net.py, line 235, in forwardx self.camlp_mixer(x) # (batch_size, F, C, L)File /home/pytorch/anaconda3/envs/pytorch_env/lib/python3.7/site-packages/torch/nn/modules/module.py, line 1130, in _call_implreturn forward_call(*input, **kwargs)File /home/pytorch/anaconda3/envs/pytorch_env/lib/python3.7/site-packages/torch/nn/modules/container.py, line 139, in forwardinput module(input)File /home/pytorch/anaconda3/envs/pytorch_env/lib/python3.7/site-packages/torch/nn/modules/module.py, line 1130, in _call_implreturn forward_call(*input, **kwargs)File /home/pytorch/LiangXiaohan/MI_Same_limb/Joint_Motion_Decoding/SelfAten_Mixer/model/S_CAMLP_Net.py, line 202, in forwardx self.time_mixing_unit(x)File /home/pytorch/anaconda3/envs/pytorch_env/lib/python3.7/site-packages/torch/nn/modules/module.py, line 1130, in _call_implreturn forward_call(*input, **kwargs)File /home/pytorch/LiangXiaohan/MI_Same_limb/Joint_Motion_Decoding/SelfAten_Mixer/model/S_CAMLP_Net.py, line 186, in forwardx self.mixing_unit(x)File /home/pytorch/anaconda3/envs/pytorch_env/lib/python3.7/site-packages/torch/nn/modules/module.py, line 1130, in _call_implreturn forward_call(*input, **kwargs)File /home/pytorch/LiangXiaohan/MI_Same_limb/Joint_Motion_Decoding/SelfAten_Mixer/model/S_CAMLP_Net.py, line 147, in forwardx self.activate(x)File /home/pytorch/anaconda3/envs/pytorch_env/lib/python3.7/site-packages/torch/nn/modules/module.py, line 1130, in _call_implreturn forward_call(*input, **kwargs)File /home/pytorch/anaconda3/envs/pytorch_env/lib/python3.7/site-packages/torch/nn/modules/activation.py, line 772, in forwardreturn F.leaky_relu(input, self.negative_slope, self.inplace)File /home/pytorch/anaconda3/envs/pytorch_env/lib/python3.7/site-packages/torch/nn/functional.py, line 1633, in leaky_reluresult torch._C._nn.leaky_relu(input, negative_slope) RuntimeError: CUDA out of memory. Tried to allocate 2.49 GiB (GPU 0; 23.70 GiB total capacity; 21.49 GiB already allocated; 550.81 MiB free; 21.53 GiB reserved in total by PyTorch) If reserved memory is allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF因为自己写的程序训练完成一轮会有输出所以这些信息是在模型预测过程中发生的。 关键的报错信息 RuntimeError: CUDA out of memory. Tried to allocate 2.49 GiB (GPU 0; 23.70 GiB total capacity; 21.49 GiB already allocated; 550.81 MiB free; 21.53 GiB reserved in total by PyTorch) If reserved memory is allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF大体意思就是显存不够了。 通过下面的代码查看程序运行过程中显卡的状态 nvidia-smi -l 1模型加载完成后此时的显卡状态 模型训练过程中显卡的状态 模型训练完成开始模型预测阶段并且是数据输入模型之后紧接着出现如下的显卡状态并且这个状态持续时间很短在显示过程中只有一次输出结果是这样的 紧接着程序报错显卡内存被释放显卡的任务栏中运行的程序也没有了 然后就感觉很奇怪觉得是梯度的问题因为在训练的时候很正常然后模型预测就出现问题了然后模型训练需要梯度信息模型预测不需要梯度信息就尝试着解决梯度的问题 就是在模型训练代码的前面加入下面这句话 with torch.no_grad():更改后的代码如下所示 with torch.no_grad():# validationmodel.eval()inputs x_eval.to(device)val_probs model(inputs)val_acc (val_probs.argmax(dim1) y_eval.to(device)).float().mean()# print(fEval : Epoch : {iter} - kfold : {kfold1} - acc: {val_acc:.4f}\n)epoch_val_acc val_acc更改之后模型预测阶段显卡的状态如下所示 然后开始新一轮的训练过程显卡的显存占用情况也没有再发生变化。 这样就不再报错了
http://www.hkea.cn/news/14443565/

相关文章:

  • 整套html企业网站模板我的网站为什么打不开
  • 淘宝客网站开发定制网站备案查询 站长的怎么实现
  • 网站开发是先给钱还是炫酷的个人网站
  • 自己做网站的视频网站建设设计技术方案模板下载
  • 金融网站怎么做的上海外贸平台
  • 网站字体合肥建设网站哪家好
  • 许昌市网站建设找汉狮仿所有网站
  • 上饶商城网站建设哪里有好看的网站
  • 遵义网站建设优化公司品牌设计全案
  • 瑞安微网站建设免费的logo网站
  • 官方网站、门户网站是什么意思?如何修改网页模版
  • 书店网站建设需求分析调研表东昌府区住房和城乡建设局网站
  • 宝安中心站做网站点击软件
  • 网站架构策划书seo2短视频发布
  • 网站上线前需要做什么自己做网站需要填税表吗
  • 网络网站制作技巧企业管理咨询与诊断实践报告
  • 安徽网站建设公司哪家好成功的品牌推广案例分析
  • 北京企业官网网站建设报价宣传推广的十种方式
  • 长春免费建站怎么自学做网站
  • 做网站讯息国内搜索引擎排名
  • 如何在网站标题加logoh5响应式网站建设价格
  • 大量word发布wordpress深圳seo云哥
  • 北京做网站那家好做网站要给ftp密码吗
  • 苏州高端网站建设kgwl30岁做网站编辑
  • 网站手机端跳转页面模板ui页面设计规范
  • 高校网站群管理系统手机怎么样做网站
  • 龙岩网站建设的软件网站滑动效果怎么做的
  • 工程建设招标网都有哪些网站wordpress 前台登陆插件
  • 电商设计网站哪个好常德市做公司网站的公司
  • 临清网站建设服务个人网站设计论文题目