首页 版块 访问AI主站 注册 发帖
happierb
21
积分 积分商城
1
获赞
[实时双翻字幕]第26次测试效果
Ta的回复 :速度比较慢。是因为网速问题还是接口问题?
46
语音识别LinuxSDK(C++)正式发布
Ta的回复 :你用的g++版本号多少?目前百度推的这个demo只支持g++4.x,不支持5。 也建议百度技术团队能发布g++5的demo,ubuntu 16.04以上都是g++5 了。
60
语音识别LinuxSDK(C++)识别越来越慢
Ta的回复 :我们自己搞好了,虽然仍然不是很明白。 用实时音频流的话,需要将usleep禁用掉。 我们猜测这个usleep只是用于传输语音文件时候用的,可能是用来模拟实时音频流的。 [代码]
6
语音识别LinuxSDK(C++)识别越来越慢
Ta的回复 :强烈要求技术团队出一个基于真实的音频流的demo。
6
语音识别LinuxSDK(C++)正式发布
Ta的回复 :linux-cpp-sdk.3.0.3.v3 在实际运行中,asr和asrDemo2,都只能打印出第一次语音活动的开始。无法打印出其后的语音活动结束、语音活动开始。 请问如何解决? 如果此问题无法解决,则:无法实现录音的分段与返回的翻译结果一一对应。 请技术部重视此BUG。 谢谢!
60
linux cpp sdk语音活动探测BUG
Ta的回复 :只能通过结果吗翻译结果吗? 源码里的这个是干嘛的? [代码] 只有“检测到一句话开始”的日志输出,没有“检测到一句话结束”的输出。。。。 另外,如果语音结束不能探测,VAD设置又有什么用呢? [代码]
3
语音识别LinuxSDK(C++)识别越来越慢
Ta的回复 :整理后的声卡实时语音流识别方法如下,共各位参考: 1,修改 recog_one_file() 文件中 [代码] 2,禁用掉源码中的usleep [代码] 3,打开终端,执行(建立管道文件,对声卡进行音频采集,直接输出到管道文件): [代码] 4,打开另一个终端,执行识别任务: [代码]
6
语音识别LinuxSDK(C++)正式发布
Ta的回复 :不知道你有没有解决,可以参看我的帖子,我在下边给出了方案: http://ai.baidu.com/forum/topic/show/497639
60
语音识别LinuxSDK(C++)正式发布
Ta的回复 :不知道你有没有解决,可以参看我的帖子,我在下边给出了声卡实时语音流的解决方案: http://ai.baidu.com/forum/topic/show/497639
60
切换版块
智能客服