最近在用飞桨写文本处理的模型,发现词嵌入这一层训练的效果很差,模型总是不收敛。怀疑嵌入层根本没有参与训练,或者参数没有共享。当我强制把embedding的param_attr设为一致,比如“shared_w”,就会报错,提示动态图模式下不能这么设置。有人知道这是为什么吗?
收藏
点赞
0
个赞
请登录后评论
TOP
切换版块