百度的短语音识别极速版和短语音识别的调用
https://vop.baidu.com/pro_api和https://vop.baidu.com/server_api 这两个请求的地方不一样吗?怎么我修改后就不行了
利用SSD训练自己的数据集
我利用官网的经典实例分割模型Mask rcnn训练自己的数据集,但是一直出错,请问数据集的格式是怎么样的,需要修改哪些参数...
语音识别程序问题
运行语音识别程序出现下述问题怎么办?
RuntimeWarning: Couldn't find ffmpeg...
iOS版语音合成结束回调调用两遍
iOS版SDK在调用如图所示的结束回调,内部代码会调用两遍,没测试过更长的文本朗读,至少现在的是调用两遍,这是怎么回事?...
如何实现智能问答
我想要通过发送url向服务器那边,wav的格式然后返回url,即想要实现语音的智能问答的功能,我改怎么做啊?
...
4G 联通 物联网卡 白名单问题
请问下, 我使用的是语音在离线合成,由于设备使用的是 4G物联网卡, 需要在 运营商那里设置白名单. 请问怎么设置, 需要固定的网络访问地址....
人脸识别唯一性
初学者,如果在角度,光线、脸型一致情况下还是想不明白人脸识别怎么才能保证唯一性,假设极端情况下,双胞胎。...
如何得到用户实际想要的答案呢
我这里识别到了用户要问‘武汉今天的天气’,怎么才能给用户真正的答案?比如说:武汉今天晴天,温度15度,之列的回答呢
...
如何开启浏览器访问麦克风功能
各位大侠。
想知道怎么让浏览器访问麦克风功能,就像百度的Demo那样,点个按钮就可以录音,然后把录音传给百度的Server端...
扫描版pdf文档识别
扫描版pdf文档识别,识别是读取每行信息,返回的坐标x,y值要怎么应用哇?或者左,上等宽度值。如何才能还原成扫描图片里的文档结构...
更新数据是否需要重新下载SDK
通用小型设备部署--图像分割WindowsSDK,更新图片是不是要重新下载SDK?
如果使用服务器部署,又是怎么更新图片和SDK呢?...
小白请教一个问题,谢谢各位大神!
在课程《Python小白逆袭大神》中,第五节课【项目】PaddleHub体验-New中,怎么将人像抠图的照片换成自己上传的?如图:...
中文文本纠错
请问大佬们中文文本纠错怎么新增数据样本,数据项目的格式是什么 Taskflow("text_correction...
求求百度改进一下审核机制吧!
试问我发“zhe ge she qu shi ge hen you huo li de ping tai, ri hou bi huo”,这种发自肺腑的赞美之词怎么就违规了呢??...
训练模型时报文件格式不对
新手训练模型报文件格式不对,不知道怎么改,请大佬指点一下 ValueError: File list format incorrect...