首页
版块
访问AI主站
登录
百度账号登录
Github账号登录
注册
发帖
happierb
0帖子
·
9回复
21
积分
积分商城
1
获赞
Ta的动态
Ta的帖子
Ta的回复
[实时双翻字幕]第26次测试效果
Ta的回复 :速度比较慢。是因为网速问题还是接口问题?
46
语音识别LinuxSDK(C++)正式发布
Ta的回复 :你用的g++版本号多少?目前百度推的这个demo只支持g++4.x,不支持5。 也建议百度技术团队能发布g++5的demo,ubuntu 16.04以上都是g++5 了。
59
语音识别LinuxSDK(C++)识别越来越慢
Ta的回复 :我们自己搞好了,虽然仍然不是很明白。 用实时音频流的话,需要将usleep禁用掉。 我们猜测这个usleep只是用于传输语音文件时候用的,可能是用来模拟实时音频流的。 [代码]
6
语音识别LinuxSDK(C++)识别越来越慢
Ta的回复 :强烈要求技术团队出一个基于真实的音频流的demo。
6
语音识别LinuxSDK(C++)正式发布
Ta的回复 :linux-cpp-sdk.3.0.3.v3 在实际运行中,asr和asrDemo2,都只能打印出第一次语音活动的开始。无法打印出其后的语音活动结束、语音活动开始。 请问如何解决? 如果此问题无法解决,则:无法实现录音的分段与返回的翻译结果一一对应。 请技术部重视此BUG。 谢谢!
59
linux cpp sdk语音活动探测BUG
Ta的回复 :只能通过结果吗翻译结果吗? 源码里的这个是干嘛的? [代码] 只有“检测到一句话开始”的日志输出,没有“检测到一句话结束”的输出。。。。 另外,如果语音结束不能探测,VAD设置又有什么用呢? [代码]
3
语音识别LinuxSDK(C++)识别越来越慢
Ta的回复 :整理后的声卡实时语音流识别方法如下,共各位参考: 1,修改 recog_one_file() 文件中 [代码] 2,禁用掉源码中的usleep [代码] 3,打开终端,执行(建立管道文件,对声卡进行音频采集,直接输出到管道文件): [代码] 4,打开另一个终端,执行识别任务: [代码]
6
语音识别LinuxSDK(C++)正式发布
Ta的回复 :不知道你有没有解决,可以参看我的帖子,我在下边给出了方案: http://ai.baidu.com/forum/topic/show/497639
59
语音识别LinuxSDK(C++)正式发布
Ta的回复 :不知道你有没有解决,可以参看我的帖子,我在下边给出了声卡实时语音流的解决方案: http://ai.baidu.com/forum/topic/show/497639
59
切换版块
操作指南
常见问答
平台公告
经验交流
技术专区
文字识别
人脸识别
语音技术
PaddlePaddle
EasyDL
BML
EasyData
AI Studio
UNIT
人体分析
图像搜索
图像识别
内容审核
自然语言处理
机器人视觉
视频技术
增强现实
知识图谱
智能创作
智能呼叫中心
文心
EdgeBoard
DuerOS
EasyEdge
度目硬件
百度AI市场
Doris
AI赛事
百度之星大赛
AI Studio人工智能竞赛
语言与智能技术竞赛
千言数据集
集思广益
共享工具
头脑风暴
成果展示
智能客服