如何获取图像文字的方向
| | |✔|✔||confidence| |✔ |✔|✔||text_region| ✔| | |✔ |
这里怎么返回angle?
...
关于PCM压缩为opus格式
, max_data_bytes);解码时,第二个参数要求是opus_int16,怎么将PCM文件读到的audio_buf转换成该格式?
有木有大神知道,求指导,多谢...
iOS 音频流识别问题
各种方案,比如降低采样率到16000 但是也不行,请问在音频采样率不满足16000 的时候怎么实现音频流识别。 这个问题已经困扰我3天了...
15年下载的语音sdk运行到前天突然不起作用了
android,系统自动帮我填充了包名(包名是正确的),然后保存了设置。结果是语音完全不合成了,不管怎么设置日期也没用了。15年的sdk用的是“com.baidu.speechsynthesizer_1.1.1.jar”这个jar包,是不是不再支持了?。。。
...
自动微分:在计算高阶导数时出错
改为:x.requires_grad=True),用torch不会有这个问题。Paddle的自动微分计算高阶导数到底该怎么实现呢?
...
单机多卡训练卡住
单机多卡训练会卡住不动,这是怎么回事? [10/09 20:25:06] ppdet.engine INFO: Epoch: [0...
模型巨大的情况,如何解决问题呢?
。。。 我现在用的网络结构体量算不上很大,只用了其中的3万6千张图片,GPU使用的是尊享版4卡的V100,计算下来,都需要跑20天这么夸张。 大家都是怎么处理大模型的啊,请指教指教! ...
【AI社区章程与准则】开发者行为规范
及时修改相关信息。如果开发者提供的个人信息资料不准确,百度AI开放平台保留结束开发者使用本站提供的网络服务的权利。在开发者需要帮助或者发生纠纷...