首页 版块 访问AI主站 注册 发帖
xie_yongkang
172
积分 积分商城
0
获赞
注册开发者时提示手机号已使用
Ta的回复 :仕书桂: 5楼的答案就是瞎说。 回复仕书桂:请使用 https://passport.baidu.com/?getpassindex&tt=1453085100992&gid=F38C81F-620F-4A71-965B-71C43424D73E&tpl=mn&u=https%3A%2F%2Fwww.baidu.com%2F 找回密码, 谢谢
4
录制的语音格式是什么? PCM 还是 MP3 ? 录制完成后保存的本地路径 是哪里?
Ta的回复 :您好, 能否给出具体代码? 谢谢
3
预期使用离线语音识别时,提示网络错误
Ta的回复 :不必了一直都在: 回复c5812:请注意我的回答,我是指在我自己写的Demo不成功之后,使用官方Demo进行过同样的操作。 回复不必了一直都在:您好, android版SDK暂不支持离线识别功能, 后续升级, 谢谢
7
“百度语音试用服务9999天后到期”?这个是怎么回事儿?
Ta的回复 :孙秋龙93: 我使用的服务是:android-语音合成 调用的接口是: 参数设置情况: 开发平台和机型:android SDK版本号:2.2 代码或日志截图(上传截图能帮助您更快解决问题): 复现步骤、现象及其他描述:“百度语音试用服务9999天后到期”提示音 回复孙秋龙93:你好, 请尽快在系统中绑定应用正式包名并使用正式授权文件, 同时尽量保持设备联网, 谢谢!
1
百度的rest api 只支持pcm 8k 的数据吗?
Ta的回复 :402168: 你好,pcm文件在此:https://pan.baidu.com/s/1kVJoKlh 只要是8k,就能识别,16k就返回识别错误。16k转成其他播放格式能播放。请检测,谢谢。 回复402168:您好,根据您的反馈, 对您提供的三个16kHz的pcm进行了rest api中语音合成的调用, 都能识别。请看一下是否是调用代码或参数设置的问题, 谢谢。 {"corpus_no":"6413902433841657479","err_msg":"success.","err_no":0,"result":["百度语音识别,请赐是白电,"],"sn":"935734228571493353032"} array(5) {   ["corpus_no"]=>   string(19) "6413902433841657479"   ["err_msg"]=>   string(8) "success."   ["err_no"]=>   int(0)   ["result"]=>   array(1) {     [0]=>     string(39) "百度语音识别,请赐是白电,"   }   ["sn"]=>   string(21) "935734228571493353032" } {"corpus_no":"6413912269217850209","err_msg":"success.","err_no":0,"result":["今天的天气很好很好,"],"sn":"28611325871493355321"} array(5) {   ["corpus_no"]=>   string(19) "6413912269217850209"   ["err_msg"]=>   string(8) "success."   ["err_no"]=>   int(0)   ["result"]=>   array(1) {     [0]=>     string(30) "今天的天气很好很好,"   }   ["sn"]=>   string(20) "28611325871493355321" } {"corpus_no":"6413912420519336146","err_msg":"success.","err_no":0,"result":["百度语音,请测试百度语言,请测试,"],"sn":"657238044121493355356"} array(5) {   ["corpus_no"]=>   string(19) "6413912420519336146"   ["err_msg"]=>   string(8) "success."   ["err_no"]=>   int(0)   ["result"]=>   array(1) {     [0]=>     string(51) "百度语音,请测试百度语言,请测试,"   }   ["sn"]=>   string(21) "657238044121493355356" }
4
REST API 语音合成 backend error 的问题
Ta的回复 :LEOD_86: 回复fujiayi1984: 返回的请求内没有sn和idx参数,只有err_msg和err_no。 请求生成的内容全文如下(自己的程序逻辑英文存在截断单词的问题,暂时没有处理): 何超仪NO.3 特朗普女儿伊万卡NO.5 阿丽亚娜·洛克菲勒  近日,全球最大的视频网站YouTube评选出了“全球15大最炙手可热的富豪千金(15 Hottest Billionaire Daughters)”。美国总统特朗普的女儿伊万卡,F1赛车协会总裁伯尼·埃克尔斯通的两个女儿佩特拉和塔玛拉,美国石油大亨洛克菲勒家族的孙女阿丽亚娜·洛克菲勒均榜上有名。赌王何鸿燊的女儿何超仪也有入选排名第九位,并且是唯一的亚洲及从事演艺事业的入榜女性。NO.9 何超仪  据悉,该榜单的评选标准不止要看各千金所在家族的财富及影响力,还有看其本身的样貌、知名度,及其在业界的地位。何鸿燊与何超仪  YouTube在报道中大赞何超仪漂亮又有才华,是著名演员及歌手。作为此次唯一一位亚洲入选者,赌王千金何超仪出道以来影视歌三栖发展,前后出过8张专辑,参演过6部电视剧,50多部电影及4部舞台剧。曾获得第36届台湾电影金马奖最佳女配角,并凭借电影《豪情》获得第23届香港电影金像奖最佳女配角,2014年主演电视剧《再战明天》并获TVB最佳女配角。2015年,何超仪更赴英国接受由英国皇家Prince of Stephan Tchernetich颁授的爵位,获封女爵位。责编:宋菁 回复LEOD_86:您好, 我们测试了您所给的文本可以正常合成, 503的原因可能是使用的合成语速过低导致的, 建议将语速设置为5以上, 并将超时CURL的超时设置到20秒, 谢谢
2
123
Ta的回复 :黑色键盘98: 123[图片] 回复黑色键盘98:感谢关注
10
为什么识别出来的结果都是以逗号结尾?
Ta的回复 :自由○莱茵哈特: 如题 100%逗号结尾 回复自由○莱茵哈特:您好, 感谢您的关注, 我们后续进行优化, 谢谢
1
PHP调用需要自己录音然后上传到自己的服务器在提交到百度语音吗?还是可以直接调用百度的UI
Ta的回复 :蔡游锐: PHP调用需要自己录音然后上传到自己的服务器在提交到百度语音吗?还是可以直接调用百度的UI 回复蔡游锐:感谢您的关注
2
python3 调用百度语音识别服务 总是返回 {'err_msg': 'url param cuid error.', 'err_no': 3300, 'sn': '26556231821490279985'}
Ta的回复 :opticaloptical: 我使用的服务是:REST API 调用的接口是: http://vop.baidu.com/server_api?lan=zh'+'?cuid='+cuid+'&token='+token 参数设置情况: VOICE_RATE = 8000 WAVE_FILE = "D:/record.wav" WAVE_TYPE = "wav" 单声道 开发平台和机型:windows10,64位,pycharm, python3.6 SDK版本号: 代码或日志截图(上传截图能帮助您更快解决问题): import requests import json import wave import base64 import os import pyaudio #录音功能在另一个模块中实现,将录音功能存入本地文件中 #获取token API_KEY='XX' SECRET_KEY='YY' authUrl='https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id='+API_KEY+'&client_secret='+ SECRET_KEY response=requests.get(authUrl) print(response) res=json.loads(response.content) token=res['access_token'] #语音识别 srvUrl='http://vop.baidu.com/server_api?lan=zh'+'?cuid='+cuid+'&token='+token print(srvUrl) #设置音频属性,根据百度的要求,采样率必须为8000,压缩格式支持pcm(不压缩)、wav、opus、speex、amr VOICE_RATE = 8000 WAVE_FILE = "D:/PycharmProjects/Exc/PPP/record.wav" #音频文件的路径注意win下用/,\在python中有转意的含义 WAVE_TYPE = "wav" #打开音频文件,并进行编码 with open(WAVE_FILE,"rb") as f: speech_data=f.read() #进行编码 speech_base64 = base64.b64encode(speech_data).decode('utf-8') #size = len(speech_data) size=os.path.getsize(WAVE_FILE ) update = json.dumps({'format':WAVE_TYPE, 'rate':VOICE_RATE, 'channel':1,'cuid':"E4-02-9B-ZZ-YY-XX" ,'token':token,'speech':speech_base64,'len':size}).encode('utf-8') httpHeaders={ 'Content-Type':'audio/wav;rate=8000', } response=requests.post(srvUrl,headers=httpHeaders,data=update) res=json.loads(response.content) text=res['result'][0] print("识别结果",text) 接口调用总是失败,debug之后发现具体错误信息如下: {'err_msg': 'url param cuid error.', 'err_no': 3300, 'sn': '26556231821490279985'} 请问是什么原因(怀疑是编码处导致的问题) 复现步骤、现象及其他描述: 回复opticaloptical:感谢您的关注
3
识别REST API发布apk在手机上的返回值是空(错误信息都没有返回)
Ta的回复 :啁劫轮: 我使用的服务是:语音识别REST API 调用的接口是:REST API 参数设置情况: 开发平台和机型:安卓 SDK版本号: 代码或日志截图(上传截图能帮助您更快解决问题): 复现步骤、现象及其他描述: 语音识别REST API在PC上运行都能正常识别,但是发布apk在手机上的返回值是空的(连错误信息都不给返回)! REST API不是说是全平台的吗?是不是不支持安卓啊? 回复啁劫轮:感谢关注
2
怎么老是离线授权失败?
Ta的回复 :jackal85: 回复xie_yongkang: 设备在线正常,关了网络就不正常了 回复jackal85:您好, 请给一下您的具体设置, 谢谢。
7
REST_API测试文档报错
Ta的回复 :您好, 可能是对于获取token阶段的解析错误, 请确认java版本的demo中, apiKey, secretKey, cuid等配置是否正确填写, 谢谢。
1
python3调用识别REST-API报3301错误
Ta的回复 :您好, 能了解一下把语音合成的结果再作为语音识别的输入的实际场景是什么吗? 另外, 识别返回的是mp3格式需要转换后才能作为语音识别的输入(8/16kHz的pcm), 谢谢
5
如何手动停止语音识别,而非自动检测用户停止说话
Ta的回复 :您好, 你所描述的场景是长语音识别的功能所支持的, 该版本即将上线, 敬请期待, 谢谢。
1
可以手动停止语音识别吗,而不是自动检测用户停止说话后就开始识别, 手动促发语音识别
Ta的回复 :csonnet: 我使用的服务是:android sdk 调用的接口是:离在线语音识别 Android SDK 参数设置情况: 开发平台和机型: SDK版本号: 代码或日志截图(上传截图能帮助您更快解决问题): 复现步骤、现象及其他描述: 回复csonnet:您好, 您所说的场景是长语音功能所支持的, 该版本近期将上线, 敬请期待,谢谢。
3
合成的PCM格式的语音有噪音,能否去掉
Ta的回复 :您好, 可能是后期将mp3进行格式转换引入的问题, 原合成波形如下, 没有明显噪音, 谢谢。[图片]
2
获取access token的逻辑处理
Ta的回复 :您好, 两种方案其实各有利弊: 第一种方法, 如果能对您的AK/SK做到较好的安全保护, 即不在用户手机端泄漏appKey和secretKey, 那么在性能和稳定性上会更合适(无须服务器中转)。 第二种方案, 如果单纯是token的转发可能会有问题, 但可以做成服务请求的中转, 这样AK/SK不对外泄漏, 相对是安全的, 但会多一层请求转发, 性能有损失, 而且中转服务器的稳定性会成为瓶颈。 以上仅供参考, 谢谢。
3
高级语音控制收费方式是怎样的?
Ta的回复 :请邮件至voice_feedback@baidu.com, 谢谢
0
python3调用识别REST-API报3301错误
Ta的回复 :ighack: 回复xie_yongkang: 没什么我就是想测试一下语音识别的功能。看一下我的写的代码有没有什么问题,我拿科大飞讯合成的语音是没有问题。证明我的代码写的没问题。 回复ighack:您好, 感谢您的使用,两边的接口输入和返回格式有差异, 百度语音合成的rest api返回的是mp3格式。按照您所描述的设想, 经过转码成8/16kHz的PCM后, 调用百度语音识别的rest api, 同样可以正确识别, 谢谢。
5
切换版块
智能客服