为满足用户不同场景的情感倾向分析需求,NLP方向已上线了【情感倾向分析定制化】服务!
针对用户您特定的应用场景,我们使用您提供的自选语料,有效提高情感倾向分析在您特定环境下的精度和准度!
情感倾向分析的定制化功能可以满足您多种多样的场景,比如对评论中感情倾向的分析,对新闻标题感情的审核等。详细的产品信息,请您查看产品页面:
https://ai.baidu.com/tech/nlp_apply/sentiment_classify
【情感倾向分析定制化的使用流程】
1.登录控制台 -> 2.创建应用 -> 3.创建模型并上传语料 -> 4.模型训练 -> 5.模型生效 -> 6.调用模型
【详细的使用步骤】
1. 登录控制台
进入百度AI官网https://ai.baidu.com/
点击右上方『控制台』(如图1-1),如果此时您尚未登录, 需要使用百度账号或百度云账号进行登录。之后在左侧展开菜单中选中『自然语言处理』(如图1-2)。
下图1-1
下图1-2
2. 创建应用
a) 当您登录成功后, 您会进入『自然语言处理』的『概览』页面。 从页面中部, 您可以点击『创建应用』按钮(如图2-1)。如图所示:
下图2-1
b) 之后页面跳入『应用列表』的『创建新应用』页面(如图2-2)。请您填写『应用名称』,选择『应用类型』,『接口选择』,填写『应用描述』。请您尽量按真实情况填写或选取信息。便于您日后对应用进行管理。此处已将『情感倾向分析(定制)』默认勾选。
下图2-2
c) 之后创建成功后,您将看到新申请的应用,点击『返回应用列表』或『查看应用详情』,你可以看到对应的App ID, API Key, Secret Key(如图2-3)。这些ID和Key值在您开发应用时还会用到。
下图2-3
3. 创建模型并上传语料
a) 应用的初次模型创建
- 在『应用列表』页打开创建模型弹窗:点击左侧导航区『自然语言处理』下方的『个性化定制』,选择『情感倾向分析定制』,选择您需要定制的应用(初次则应用内没有模型),并点击『创建模型』(如图3-1),此时会有弹窗提示(如图3-2)。
下图3-1
- 填写模型名称和应用场景:弹窗内需要您填写『模型名称』、『应用场景』(如图3-2)。模型名称请输入10字以内的可以区别开您其他模型的名称。应用场景请用少于50字大致描述一下您使用该模型的场景。此两项为必填信息。
下图3-2
- 数据导入与数据类型:同时该弹窗需要您上传数据。上传的为您的正向语料和负向语料,正向为您认为情感倾向正面的话语,负向为您认为倾向负面的话语,中性话语不需要上传。上传文件为编码格式UTF8的TXT格式文件。语料的格式可参考按钮下方蓝色的『下载正向语料示例』和『下载负向语料示例』.
- 数据导入与数据量:语料文件每行一条数据,任一语料文件要多于100条,为保证定制化效果,最好多于1000条,上传文件最大支持5M。模型至少要上传正或负一类语料,但支持仅上传正向或负向语料。不过为了保证更好的效果,建议您正向和负向语料都进行上传,正负数据量比例尽量均衡(1:1)。
- 上传失败:若上传失败,会有提示告知您原因,请您检查语料,确保语料符合上面的要求。
- 立即创建:点击『立即创建』,模型创建完毕(如图3-3)。若您仅上传了正向或负向语料,会对您提醒,但您仍可继续。
下图3-3
b) 应用的二次及多次模型创建
- 应用列表查看应用详情:对于已有创建的模型的应用,在应用列表页显示的则为『查看详情』(如图3-4),点击则跳转应用详情页,会展示已创建的模型。
下图3-4
- 应用详情页创建模型:在应用详情页(图3-5),可以点击『新建模型』打开模型创建弹窗。后续的操作和第一次创建模型时一致。我们暂时的限制是一个应用下面只能建立5个模型,到5个之后『新建模型』会置灰。
下图3-5
4. 模型训练
a) 模型状态:当您成功创建了模型之后,您就可以开始训练该模型了。在应用详情页可以看到排列的已创建模型。模型分为以下几个状态:模型未训练,模型训练中,模型训练成功,模型训练失败,模型生效中,模型已生效,模型生效失败。具体的介绍在下面的步骤会详说。
b) 立即训练:对于刚刚创建的模型(即状态『模型未训练』),点击『立即训练』即可开始训练模型(如图4-1)。值得注意的是,如果有其他模型在训练,则需要等到训练完毕,才能开始新的模型训练,我们对于这种情况会将『立即训练』按钮置灰。
下图4-1
c) 模型训练中:开始训练的模型会进入『模型训练中』的状态(如图4-2),您可以关闭窗口,训练不会中断。此时模型不能被删除,不能被替换语料,其他模型不能同时训练。
下图4-2
d) 模型训练成功:训练成功的模型状态会变成『模型训练成功』(如图4-3),此时如果替换语料,则模型需要重新训练。窗口中可以查看到模型的准确率,并与通用模型准确率比较。同时可以通过『查看评估详情』来看下详细的评估情况(如图4-4)。
下图4-3
e) 评估详情:
第1 列:用户原始训练数据,就是定制化训练时,我们会切分1/10 的数据用于评估。
第2 列:原始训练数据的label,用户上传的正向语料和负向语料,我们处理的时候会打上label,2 表示正向,0 表示负向。
第3 列:定制化前的评估结果,2 表正向,1 为中性,0 为负向。
第4 列:定制化后的评估结果:2 表示正向,1 为中性,0 为负向。
下图4-4
f) 模型训练失败:若训练失败,则可以重新发起『立即训练』。
5. 模型生效
a) 立即生效:对于训练好的模型(状态:模型训练成功)可以点击『立即生效』来生效模型。模型生效5~10分钟,状态为『模型生效中』(如图4-5)。模型生效中不允许删除模型,不允许替换语料。
下图4-5
b) 替换已生效:一个应用仅支持生效一个模型,若您生效模型时已有模型生效,则新训练好的模型将替换已生效的。
c) 模型已生效/模型生效失败:生效好的模型可以请求API接口来使用(图4-6),此时模型不能被替换语料。模型生效失败可以重新『立即生效』或者联系我们反馈问题(图4-7)。
下图4-7
6. 调用
a) 模型生效后,您可以通过API接口的方式进行调用,API地址为:https://aip.baidubce.com/rpc/2.0/nlp/v1/sentiment_classify_custom
(通用版和定制版的调用地址有区别,请按需选择)
API接口调用文档的说明请见:https://ai.baidu.com/ai-doc/NLP/zk6z52hds
API接口调用文档的说明链接为什么打不开?
感觉不太会用
欢迎您留下宝贵的建议,我们将收集反馈给PM,给大家提供更优质的产品服务
请您加自然语言处理的技术支持群,反馈问题的详细描述,帮您解决,自然语言处理技术支持qq群:632426386
目前NLP技术仅适用于简体中文哈
请问支持识别英文吗
为什么训练了半个小时了还不行
这操作太不人性化
请问怎样提高模型的准确度?
文档呢?
返回的结果当中,置信度是怎么去理解呢? 是指模型的置信度,还是当前分类的置信度?以及为什么会有的返回结果只有1个,有的却有多个呢?
必须上传正负资料吗?
进行调用时,调用API的地址错误怎么解决?
具体该怎么调用模型呢?我不能调用啊
请问结果分类的时候多少分会被分为负面,多少分是中性,多少分是积极呢?
不是还是可以用么?
请问,百度采用的贝叶斯分类器么?还是其他的?
暂时还不支持,您可以关注下这里,表明sdk支持的能力:http://ai.baidu.com/docs#/NLP-Java-SDK/58fc7310
那就没办法用sdk了对吧