百度之星资格赛参赛者标注数据错误示例
z00ux 发布于2017-07 浏览:3417 回复:6
0
收藏

关于资格赛模型学习效果的问题,我们随机抽取了一些大家标注的训练数据,并根据比赛的标注标准进行了分析,

结论如下:整体看参赛着标注的数据,餐厅垂类的整体准确率只有46%,电影垂类是 69%,整体看标注偏低。

那么机器学习是拿着大家的标注数据做为教材来学习的,如果标注数据的准确率偏低的话,那么它的效果上限

也就是咱们标注的准确了。


下面是一些大家在标注中的错误示例,供大家参考,避免类似的标注问题。总得来说高质量的标注才有好学习效果,加油!


收藏
点赞
0
个赞
共6条回复 最后由青岛响水米业回复于2017-08
#7青岛响水米业回复于2017-08
#3 756665228回复
第一

大神求带


0
#6gdlufdc回复于2017-07
 请问比赛需要识别的意图是否只有指定的三个以及负例(SYS_OTHER),而不包含其他的澄清意图? 
0
#5kiujing2回复于2017-07
#4 183*****120回复
想问下这个“负例”是啥意思?

负例是指非本类别需求的query。如:餐厅类别,非餐厅需求的query就属于负例;电影类别,非电影需求的query就属于负例

0
#4183*****120回复于2017-07

想问下这个“负例”是啥意思?

0
#3用户已被禁言回复于2017-07

第一

0
#2哇哇哒哇哒回复于2017-07

0
TOP
切换版块