多轮会话时没有继承上一轮会话中的词槽信息
机器人进行多轮会话时,第二轮对话session_id添加了上一轮对话返回的session_id,但是并没有继承上一轮的词槽信息,导致返回无法识别,在百度后台页面测试对话时是正常的,这是什么原因...
语音识别的录音格式是.WAV 可以吗?
步骤、现象及其他描述:
语音识别的录音格式是.WAV 可以吗,这个扩展名有大小写区别吗?
PS:我使用的Linux下的C++程序测试的,返回3301,不知道是不是因为这个格式的原因...
PP-Structure表格识别遇到图片旋转会失效
实际用的时候发现的,有点尴尬,要转的PDF图片旋转了90度,然后用PP-Structure表格识别就傻眼了。
手动把图片转正,可以正常识别。
建议迭代的时候修复这个bug?哪怕给个参数让用户手动指定旋转图片也行啊。...
关于语音识别speex格式问题
百度语音识别开发者们:
你们好,我在项目中为了减少网络数据流量大小,采用speex进行语音数据压缩,speex的音频格...
文字识别空格识别问题求助
图片识别文字的时候,同一行会有空格,读取出来就直接变成了两个words..然后是分割开的,就很奇怪,想问下有没有谁知道关于空格的问题要怎么解决,有没有什么相对来说比较好的解决方式...
强化学习七日打卡营总结
学习基本路线:
搭建环境--强化学习初印象--基于表格型方法求解RL--基于神经网络求解RL--基于策略梯度求解RL--连续动作空间上求解...
文字识别格式
ocr识别类似图中图片,文字内容以纵向识别返回了,请问可以控制横竖向来识别返回文字内容嘛?
代码贴图:
utf-8编码格式下的错误
{"corpus_no":"6389091877539680505","err_msg":"success.","err_no":0,"result":["\xe6\x88\x91\xe5\x8f\xab\xe5\xb0\x8f\xe8\x8b\xb9\xe6\x9e\x9c\xef\xbc\x8c"]
识别成功但是,返回...