实践指南,一站式教学搞懂文本信息抽取
用户已被禁言 发布于2021-03 浏览:4888 回复:2
1
收藏
最后编辑于2022-07

近日,自然语言处理领域权威排行榜——GLUE(通用语言理解评估基准)新排名出炉。百度自研的语义理解技术与平台文心(ERNIE)以90.9的分数再登榜首,领先微软DeBERTa/TuringNLRv4,谷歌T5以及阿里巴巴、华为等研发的其他同类别技术。

在技术产业落地的进程中,文心也在不断发力,将最新的世界级技术突破转化为易用的产品工具,携手EasyDL平台提供了一整套简单高效的NLP开发能力,有效提升模型开发与应用效率。

针对用户文本信息抽取的需求,文心上线了“文本实体抽取”和“文本实体关系抽取”功能,支持从海量信息源中抽取出特定的实体,并定义实体间的关系。如抽取保险合同中的投保人、投保年限等信息,并建立两者间的关系,辅助保险经理人分析判断。

那如何快速给数据打标签?

怎样达到高精度的模型效果?

如何从简单信息抽取到构建知识图谱?

零深度学习经验能轻松上手吗?

针对以上问题,3月25日,百度EasyDL-NLP专场直播课“从技术解析到实战演练,文本信息抽取模型精讲”来袭,从数据处理到模型训练,全程0代码可视化操作,教你快速掌握“信息抽取”技能。

 

课程亮点,先睹为快!

 

实体抽取与实体关系抽取,高效获取知识

“文本实体抽取”作为文本挖掘和信息抽取的核心任务,支持从海量信息源中抽取出特定的事实信息,是信息检索、智能问答、智能对话等人工智能应用的重要基础;“文本实体关系抽取”除了能抽取出预定义的实体类型,还能抽取出实体间的关系类型,得到包含语义信息的实体关系三元组,可用于构建和扩充知识图谱。例如:“王雪纯是87版《红楼梦》中晴雯的配音者。”可以抽取出“王雪纯-配音-红楼梦”这一组关系。

在线智能标注,节约成本

为提升该项能力的易用性,文心还针对数据准备难题,发布了基于2项任务的数据标注工具,支持在文本中直接划选进行标注,给标注人员带来极佳的标注体验和更高的标注效率。如下图所示,可以通过可视化的操作直接对目标信息进行标注,抽取金融类合同中的企业主体、注册资本,并直接建立两者间的关系。

除了上述新功能的介绍,课程还将带领大家全流程实践操作,从了解原理到定制模型,从跟随操作到独立实现,快速打通文本信息挖掘的任督二脉。

 

百度工程师手把手教学案例实现

本次公开课,百度工程师将从创建模型、准备数据、训练模型、校验模型、发布模型全流程进行实操演练,带领大家基于样例数据三步定制一个实体关系抽取模型。还在等什么,速速报名吧,让我们一起见证文本智能化的神奇魅力!

时间:3月25日20:00-21:00

报名方式点击报名链接https://iwenjuan.baidu.com/?code=637tuz 或扫描下方海报中的二维码,添加小助手微信,备注“NLP”,获取专属报名通道。参与课程,还有爱奇艺VIP黄金会员月卡、百度大脑定制马克杯等惊喜礼品等你拿!

更多“课程介绍”及“课程亮点”见下图!

收藏
点赞
1
个赞
共2条回复 最后由186******52回复于2022-07
#4city城市印象回复于2021-03

已报名

0
#2rose20135188回复于2021-03

已报名。

0
TOP
切换版块