请问语义解析任务评测标准的细节

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

磐鉐发布于2020-03

请问计算component acc时是否考虑value的准确性？

例如：
gold: **** where 时间 >= '1989-10-10' order by **** desc limit 3
predict: **** where 时间 >= VALUE order by **** desc limit 1

如果VALUE缺失或错误，component acc怎么计算？谢谢。

0

收藏

回复

全部评论(3)

B

Baeseulging

#2 回复于2020-03

评测方法 Evaluation
各参赛系统生成的SQL query与测试集人工标注的标准SQL query进行组件精确匹配, ...

我理解缺失或错误的话，该value组件不得分吧

0

回复

磐鉐

#3 回复于2020-03

Baeseulging #2

评测方法 Evaluation 各参赛系统生成的SQL query与测试集人工标注的标准SQL query进行组件精确匹配, ... 我理解缺失或错误的话，该value组件不得分吧

英文数据集spider是不做value验证的，而且如果做验证的话，还要统一格式标准，例如上述例子在question中是"1989年10月10日"，在table和sql_query中是"1989-10-10"。

0

回复

B

Baeseulging

#4 回复于2020-03

磐鉐 #3

英文数据集spider是不做value验证的，而且如果做验证的话，还要统一格式标准，例如上述例子在question中是"1989年10月10日"，在table和sql_query中是"1989-10-10"。

展开

spider确实没有验证value，但一个完整的语义解析任务，对value的匹配和标准化处理也是个难点，直接影响执行准确率。
等看官方怎么说。

0

回复