PaddlePaddle版本:1.6.3 CUDA/CUDNN/GPU:10.2/v7.6/GeForce RTX 2080 系统环境:CenterOS 6.3
单卡训练,输入为lod_level=2的序列,无论以哪种方式初始化embedding matrix,前向计算结果均为nan,确定输入的ids没有问题,字典大小10784,embedding大小128。 代码截图: 特征截图:
发现是在没有训练情况下iteration=0就开始了test_eval导致出现nan。移除eval后在train的过程中正常的
PaddlePaddle版本:1.6.3
CUDA/CUDNN/GPU:10.2/v7.6/GeForce RTX 2080
系统环境:CenterOS 6.3
单卡训练,输入为lod_level=2的序列,无论以哪种方式初始化embedding matrix,前向计算结果均为nan,确定输入的ids没有问题,字典大小10784,embedding大小128。


代码截图:
特征截图: