百度之星资格赛参赛者标注数据错误示例

首页版块访问AI主站注册发帖

百度之星资格赛参赛者标注数据错误示例

精

官

z00ux 发布于2017-07 浏览:3796 回复:6

百度之星资格赛参赛者标注数据错误示例

快速回复

关于资格赛模型学习效果的问题，我们随机抽取了一些大家标注的训练数据，并根据比赛的标注标准进行了分析，

结论如下：整体看参赛着标注的数据，餐厅垂类的整体准确率只有46%，电影垂类是 69%，整体看标注偏低。

那么机器学习是拿着大家的标注数据做为教材来学习的，如果标注数据的准确率偏低的话，那么它的效果上限

也就是咱们标注的准确了。

下面是一些大家在标注中的错误示例，供大家参考，避免类似的标注问题。总得来说高质量的标注才有好学习效果，加油！

其他

个赞

共6条回复最后由青岛响水米业回复于2017-08

#7青岛响水米业回复于2017-08

对#3 用户已被禁言回复

第一

大神求带

#6gdlufdc回复于2017-07

请问比赛需要识别的意图是否只有指定的三个以及负例（SYS_OTHER），而不包含其他的澄清意图？

#5kiujing2回复于2017-07

对#4 183*****120回复

想问下这个“负例”是啥意思？

负例是指非本类别需求的query。如：餐厅类别，非餐厅需求的query就属于负例；电影类别，非电影需求的query就属于负例

#4183*****120回复于2017-07

想问下这个“负例”是啥意思？

#3用户已被禁言回复于2017-07

第一

#2哇哇哒哇哒回复于2017-07

快速回复

小编推荐

【7.18升级】自动预标注上线、词典值管理升级

TroubleMaker源 7回复

【智能对话深度实战营】首批训练师认证名单公示

魏亚非669 38回复

语音语义一体化全新升级，一次数据交互全搞定

用户已被禁言 18回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服