推荐对话驱动任务的输出
收藏
看了看介绍,说是一行回复一句。但是感觉这样子说很模糊,比如对于我们的test_1文件,是回复history接下来的一句话就可以了吗?
0
收藏
请登录后评论
建议看一下网站上的数据集说明,test_1中每一行都是一个测试样本,每个样本预测一个回复,也就是关于history (对话历史)的回复。
这样会不会怪怪的?我看了一下test1的内容,因为存在样本重复(这里的重复是指内容基本一致,但是可能对话历史会有差别),这样不是可以和轻松利用其他样本的知识得到answer吗?(虽然这样做是不对的。)
评测脚本会自动检测出作弊