无论是企业的AI业务应用开发,还是高校师生团队的AI科研项目,想要获取高精度模型,除了需要选择一个功能完备的开发平台外,必须要考虑的是具备充足的训练数据,但这些动辄几百上千甚至上万条的数据,标注就成了令人头疼的大问题。别小看标注只是画框和点选操作,仅依赖一人进行标注的效率足以让整个AI项目陷入进展停滞的境地。
那么,秉承着效率第一和团队协作的信条,标注工作能否也团队齐上阵,让效率搭上火箭,项目进展一飞冲天?
观察到这一需求,EasyData重磅上线多人标注,并全面打通EasyDL与BML,用户可以直接在开发平台中使用此功能,化整为零、分块并行,短时间完成数据标注,模型开发流程效率再提升不是梦!
在多人标注中,共有三种角色:管理员、标注员、审核员。管理员创建多人标注任务,分配给指定的标注团队,标注员完成标注后,引入审核团队对标注员的工作进行审核,进一步提高了标注的准确率,保证了后续模型训练的标注准确性。审核员审核全部完成后,管理员对整体的标注效果进行验收,验收完成后标注工作正式结束。目前支持数据类型有文本、图片、音频和视频。
简单四步,团队协作搞定标注
1. 管理员创建团队与任务
首先,管理员创建好标注团队和审核团队,并在团队里添加相关的成员并完善信息。
团队创建好后,就可以对已有数据集的未标注图片发起多人标注任务了。如下图:
目前对数据集里面未标注的数据进行任务平均分配,在任务创建时,管理员可以灵活选择是否需要标注审核、任务截止时间、成员权限和数据保存方式。
完成任务创建并提交后,后台会自动进行任务的平均分配,并将标注任务的链接发放到标注团队成员的邮箱中。
2. 标注员进行标注
标注员点击邮箱收到的任务链接开始标注,在管理员设置的结束时间之前完成即可,标注完成后进行任务提交,根据管理员设置决定是否进行任务审核。
上图为标注员的标注页面,管理员可以为每个标签设置对应的颜色,标注框的颜色也会随之变化,以方案标注员进行标注和检查。同时,EasyData也支持标签置顶和锁定功能,便于标注员快速选择常用标签,提升标注效率和准确率。
3. 审核员进行审核
审核员点击邮箱里面的审核任务链接,在管理员设置的结束时间之前,对标注员的标注工作进行审核,审核完成后提交任务。所有审核任务都提交后,管理员进入验收环节。在整体流程中,审核员的加入分担了管理员的审核压力,也提高了对标注员的要求,通过多种方式提升数据的标注质量,提升了验收环节的效率。
4. 管理员验收
管理员可以看到标注任务和审核任务的进展,以及所有的标注详情。在需要审核的情况下,如果某个标注员的标注结果审核通过率较低,可以进行打回与重新标注,审核员与管理员也需要重新审核与验收。在验收完成之后,标注数据会保存到目标数据集中,标志着多人标注工作完成。
随着EasyData多人标注功能的上线,原本繁重的数据标注工作可以通过团队协作的方式进行分配,并且,引入管理员、审核员角色,将标注工作进一步细分,在保证数据质量的前提下,最大化提升团队协作效率。
EasyData是2020年4月百度大脑的业内首个提供软硬一体、端云协同的智能数据采集与处理平台,支持图片、文本、音频和视频四类数据的处理,包括采集、清洗、标注的一站式处理,覆盖模型开发中的各类数据管理需求。
通过EasyData进行处理和标注的数据可以直接应用于EasyDL零门槛AI开发平台和全功能AI开发平台BML,通过EasyDL与BML内置的预训练模型和各类训练工具与机制,高效定制开发高精度业务AI模型。
本次EasyData全新上线的多人标注功能也已经与EasyDL及BML完全打通,用户可以直接在EasyDL和BML平台中进行使用,一站式完成数据处理、模型定制与服务部署。
还等什么,快来体验吧!
EasyDL官网地址:https://ai.baidu.com/easydl/
BML官网地址:https://ai.baidu.com/bml/
团结协作,效率更高
有需要人员标注的不,可以找我
团结协作,效率更高