首页 PaddleNLP 帖子详情
文本相似度计算,训练样本需要做数据标注吗
收藏
快速回复
PaddleNLP 问答训练 1743 5
文本相似度计算,训练样本需要做数据标注吗
收藏
快速回复
PaddleNLP 问答训练 1743 5

文本相似度计算,训练样本需要做数据标注吗?一定需要正负样本标注吗?标注有啥策略,求大佬指点

0
收藏
回复
全部评论(5)
时间顺序
austinleaven
#2 回复于2020-05

如果需要全部标注的话工作量太大了,如果只是个人耍耍的话就只能望而却步了。应该有不需要标注的算法,但是需要标注测试集。你可以多看看blog

0
回复
水水水的老师
#3 回复于2020-05

需要做部分标注

0
回复
AIStudio810258
#4 回复于2020-05
需要做部分标注

哪部分要标注。

不是用word2vector嵌入词向量,然后就可以做文本相似度计算?

0
回复
AIStudio810258
#5 回复于2020-05
需要做部分标注

或者直接用ernie、bert这样的预训练模型也能做文本相似度比较

0
回复
AIStudio810258
#6 回复于2020-05
如果需要全部标注的话工作量太大了,如果只是个人耍耍的话就只能望而却步了。应该有不需要标注的算法,但是需要标注测试集。你可以多看看blog

有标注数据比word2vector这样的无监督学习效果更好么?

0
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户