语音识别SDK的大小问题
除了官方接入文档中使用的sdk,请问是否有比较精简的sdk,现在按照文档集成.a包后,一个简单的demo的大小都达到了63.7M,感觉这个大小有点难以接受。
百度是否提供了其他功能比较精简的sdk?...
H5前端人脸识别
有没有前端能看得懂的代码啊。一群java代码。还这么高深,看不懂啊,咋办,那个网页的例子啊,是怎么做的啊,我也想做一个网页的,然后内嵌到小程序,有没有大神能提供思路的...
集成百度语音合成,后台无法正常播放
我集成了百度提供的相应语言合成的sdk,在收到通过极光推送推送到的消息后。如果真机连着电脑,在前台后台都会收到语音播报消息。但是当手机断开连接,当程序在后台运行的时候就收不到语音播报了...
为什么语音识别返回curl_error:28错误
我用自己解码出来的16bit,16k采样率、单声道的pcm文件进行语音识别,返回curl_error_code:28的请求超时错误,但百度的监控上却显示调用成功。我用百度提供的示例pcm文件就没有这些问题。...
现在音频转写功能是否能够在android 端实现
我之前测试 时,发现官网没有提供在android 实现 音频文件 识别转写功能。自己尝试写了android demo,但是没有成功。我想知道的是android端是否能够实现,是需要和贵公司进一步沟通吗?...
语音识别前可否对声音进行处理
唤醒之后,在线的语音识别之前,录得声音,可否我们进行声音的降噪处理和回声消除再上传音频。我看SDK没有提供这两种能力,所以在音频流上传之前,我们能否自己研发加入这种能力?...
实例分割标签混乱的原因是
solov2实例分割可以检测出物体,但是标签基本都不对,看官网的模型用coco数据集时不需要标签的txt文件,按理说都是json文件里面提供的标签,那么为什么会出现这样的问题呢?...
百度AI已经深入到了细分领域了
、自然语言处理、人脸/人体识别、图像技术、知识图谱等场景化能力;企业服务、零售、商业地产、制造业、教育、金融、文化娱乐等行业应用;云+端+私有化...
车道线检测比赛解决方案及代码
提供一个baseline或者starter code,虽然我代码水平一般,但是在深度学习训练和实战方面有一些心得,这里把我这次比赛的源码和调试...
[AI达人养成营]知识总结
关于花样滑冰选手的骨骼点动作识别大赛
采用飞桨提供的PaddleVideo框架中的优化后的模型AGCN,获取更高的精度。
主要...