如何使用千言数据集?
收藏
快速回复
【千言数据集】 文章其他 1349 0
如何使用千言数据集?
收藏
快速回复
【千言数据集】 文章其他 1349 0

千言数据集是全面的面向自然语言理解和生成任务的中文开源数据集合,旨在为研究人员带来一站式的数据集浏览、整理、下载和评测的科研体验,共同推动中文信息处理技术的进步。

目前千言数据集已面向12个任务收集和建设了36个中文自然语言处理数据集。

 

(一)如何搜索和下载数据集

千言数据集官网首页按照任务方向收集和整理了相应的数据集,并且在数据集名称的左上角添加了相应标签以标明该数据集对应的具体任务方向。

用户可按照相应的任务方向找到对应的数据集,点击卡片进入数据集详情页了解数据集作者、数据集介绍、样例预览、基线系统、引用格式、MD5、相关评测比赛等详细信息。

并在页面右上角的点击下载,在同意相关法律声明后,即可获取该数据集。

 

(二)如何参加千言评测比赛

千言共有10个任务的常规赛,并不定期推出面向不同任务方向的主题赛。千言不仅为参与评测的用户提供基线系统,也通过AI Studio平台为用户提供免费算力。

可在千言数据集官网的比赛页查看目前正在进行中的评测比赛,并点击相应比赛进入AI Studio平台报名参赛。

0
收藏
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户