信息抽取任务原模型加上gru+crf性能缺下降了
收藏
快速回复
语言与智能技术竞赛 问答其他 1061 1
信息抽取任务原模型加上gru+crf性能缺下降了
收藏
快速回复
语言与智能技术竞赛 问答其他 1061 1

信息抽取任务停留讲解人的描述加上了gru+crf层,但是效果居然还不如不加,有大佬知道这是什么问题吗?

0
收藏
回复
全部评论(1)
时间顺序
小飞侠00
#2 回复于2021-10

确实,同一个信息抽取任务,我试了Ernie+CRF比单独Ernie,F1下降20%左右。用了Electra+CRF,4个epoch后F1达到最大值,但是随着继续训练,loss在下降,F1也在下降(loss和F1都是在训练集上的结果),很疑惑。

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户