首页 Paddle框架 帖子详情
wsl2里训练几个step就不动了
收藏
快速回复
Paddle框架 文章模型训练 783 5
wsl2里训练几个step就不动了
收藏
快速回复
Paddle框架 文章模型训练 783 5

项目是\NLP经典项目集\10快递单信息抽取 里的demo

环境win10, wsl2 ,cuda11.2 paddle gpu 2.1

在win10里能运行,运行时显存占用2G左右

但是在wsl2里就只能运行前几步, 然后就不动了(控制台没有新输出,看显存占用,也是2G左右), batch_size设置为2也不行

怀疑是Model.fit()的问题, 我就没使用Model高层模块,而是使用普通的  for step, batch in enumerate(train_loader, start=1) 这种来运行也不行(在win10上可以)

补充下:

其他的demo有的可以运行,比如\NLP打卡营\2文本相似度 可以在wsl2里运行

大佬们给个指点,谢谢!!

 

0
收藏
回复
全部评论(5)
时间顺序
JavaRoom
#2 回复于2021-08

wsl的cuda测试了吗?我觉得可能有关。

0
回复
去你的萨芬
#3 回复于2021-08
wsl的cuda测试了吗?我觉得可能有关。

测试过了, 跑其他demo就可以,跑这个demo时前几个step,GPU内存使用会上升,然后就下降了,说明gpu没在训练了, 此时控制台也没报错,但是没有新的log

 

0
回复
JavaRoom
#4 回复于2021-08

Wsl是玩具,不行下docker,结合用。

0
回复
去你的萨芬
#5 回复于2021-08
Wsl是玩具,不行下docker,结合用。

good idea, 我试试docker~

0
回复
去你的萨芬
#6 回复于2021-08
Wsl是玩具,不行下docker,结合用。

用docker也不行,我放弃了,还是用window吧

谢谢指点~

0
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户