首页 PaddleHub 帖子详情
PaddleHub文本相似度,训练数据BUG?
收藏
快速回复
PaddleHub 问答预训练模型 513 1
PaddleHub文本相似度,训练数据BUG?
收藏
快速回复
PaddleHub 问答预训练模型 513 1

用PaddleHub1.8.0自带的PairwiseTextMatchingTask训练,提示训练数据要求4列。

pairwise不是应该3列(query,positive_title, negative_title)吗?这里是不是一个BUG呢?

后来迫不得已,在后面随便加了一个0/1.

0
收藏
回复
全部评论(1)
时间顺序
3
3daychen
#2 回复于2020-12

你好!PaddleHub 由于 PairwiseTextMatchingTask 的loss 计算使用的是rank_loss,需要label参与计算。所以 PairwiseTextMatchingTask的训练样本需要query, left, right 和 label4个slot。

更详细的解答可以在PaddleHub的Issues板块查看,https://github.com/PaddlePaddle/PaddleHub/issues/1035

0
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户