使用外部语音流
有没有接口直接实时传入音频流进行识别,不是先把音频流写入本地再使用infile的接口上传
M:N识别
为什么将M:N加入SDK之后,识别的只有一张人脸,二照片中有很多张
语音合成读数字问题
为什么有时候会当数字读,比如一亿一千***,有时候单独读 11***,如何只当成数字单独读
cuda版本变换
为什么同一个项目有时候打开时使用的是cuda9.2,有时候就会变成10.1?
是9.2还是10.1是随机的嘛?
关于无法找到文件的错误
不知道大家有没有遇到下面的问题,在测试yolov3-tiny版本的时候,提示无法找到文件的错误
动态图dataloader
照着百度官方文档的enable_imperative没有,查了github上的issue说enable_dygraph,还是没有,用的1.80,最新的了
分布式训练文档
分布式训练的文档有些缺失啊, 1.8版本还没有之前版本的文档齐全
拼音读音识别判定
有没有关于拼音读音识别判定以及拼音手写输入识别判定的第三方的接口
语音文件转文字
REST API对语音文件有不能超过1分钟时长限制
Android SDK,和IOS SDK是否有1分钟的限制?