信息抽取任务原模型加上gru+crf性能缺下降了
收藏
信息抽取任务停留讲解人的描述加上了gru+crf层,但是效果居然还不如不加,有大佬知道这是什么问题吗?
0
收藏
请登录后评论
确实,同一个信息抽取任务,我试了Ernie+CRF比单独Ernie,F1下降20%左右。用了Electra+CRF,4个epoch后F1达到最大值,但是随着继续训练,loss在下降,F1也在下降(loss和F1都是在训练集上的结果),很疑惑。