PaddleHub文本相似度,训练数据BUG?
收藏
用PaddleHub1.8.0自带的PairwiseTextMatchingTask训练,提示训练数据要求4列。
pairwise不是应该3列(query,positive_title, negative_title)吗?这里是不是一个BUG呢?
后来迫不得已,在后面随便加了一个0/1.
0
收藏
请登录后评论
你好!PaddleHub 由于 PairwiseTextMatchingTask 的loss 计算使用的是rank_loss,需要label参与计算。所以 PairwiseTextMatchingTask的训练样本需要query, left, right 和 label4个slot。
更详细的解答可以在PaddleHub的Issues板块查看,https://github.com/PaddlePaddle/PaddleHub/issues/1035