对话式文档问答是UNIT平台通过训练文档数据来实现人机对话的技能,开发者可以通过上传不同的文档获得不同的问答能力。
pdf格式文档由于跨平台、集成度高的特点在各类场景都得到了广泛使用,为了方便广大开发者的使用,UNIT平台的文档问答功能新增了对pdf类型文档的支持,开发者将不再需要将pdf文档中的文字复制到文本文档中进行上传训练,直接上传pdf文档即可在技能内部完成文件中文字的识别,训练后直接进行对话。
详细操作步骤如下:
第一步:上传文档
第二步:训练模型
此外,考虑到部分文档仍然在使用Word格式,本次更新也增加了对doc类型文档的支持。截止目前UNIT平台已经支持了4种常见类型的文件格式,详细信息可参考下表:
更多文档问答功能信息详见:https://ai.baidu.com/ai-doc/UNIT/Qkiqvuwf0
欢迎大家来测评和反馈~
请登录后评论
TOP
切换版块
好的
支持长句,训练后语段语义不完整有可能是包含?。;此类标点导致,当前正在预备排期优化哈~
目前文档问答是不支持长句吗?在训练以后被分割了,但是分割后的语段语义明显不完整