最后编辑于2023-02
3月,百度文心NLP开发套件专业版发布,首次开放了业界期待已久的ERNIE 2.0中文预训练模型,面向产学研各界的开发者提供领先的语义理解能力。时隔两个月,文心NLP开发套件专业版V1.0.2升级上线,数据处理能力进一步增强,同时新增/升级了5大算法任务。立即体验>>
数据处理能力再升级
1. 新增“文本数据增强”功能:开发者可以基于此策略丰富已有训练集的数据特征,进而有效提升模型效果;
2. 新增“噪声样本挖掘”功能:数据标注的标准不统一或存在的歧义会导致数据标注的质量参差,通过此功能可以有效避免噪声样本在网络训练过程中带来的影响,同时也能在一定程度上降低调优过程中的计算资源消耗;
新增多种算法任务
1. 新增“小样本分类”任务:结合few-shot分类技术与效果领先的中文预训练模型ERNIE,显著提升在数据集中样本较少情况下的文本分类效果;
2. 新增“文本语义向量化”任务:文心提供两种方式来获取文本语义向量,一是通过ERNIE-Sim模型进行预测来获取语义向量,二是使用数据对ERNIE-Sim模型进行fine-tune得到语义向量;
3. 新增“Term重要性”任务:给出一个明文文本中每个短语的重要程度,常用于query理解等场景;
4. “阅读理解”任务能力升级:能力升级后,可以针对训练得到的模型进行推理服务。
抢先体验:https://wenxin.baidu.com/wenxin/sdk
请登录后评论
TOP
切换版块
好样的,利益集团的关系工具,宣传家百度文心一言。
总体上有较大进步,但在启发式写作这一块,感觉文本的连续性和整合度不够高。
太酷了!
ERNIE对小样本的提升太显著了
酷酷酷!