抽取短文本的中心思想的模型
收藏
作短文本相似度比较,发现效果总是不很理想。有时候一句话,换个说法,相似度就会下降很多。
例如:“实施的培训均未进行培训效果评价。” 和“两次驾驶员培训,均没有对培训效果进行评价。”,相似度只有0.71.,
其实这两句话的中心意思,都是没有作培训效果评价。
有没有什么模型,可以先提取短文本的中心思想,再进行比较?
0
收藏
请登录后评论
我理解一般的如ernie, bert这样的模型是在词语水平上embedding向量的。抽取中心思想,这是要做回归啊。
的确