语音识别Python SDK文档写的真垃圾
cuilaixi 发布于2019-04 浏览:3889 回复:12
2
收藏

为什么按照描述跑不起来?一直报错param format invalid?

为什么腾讯的ai文档按照写就能跑起来?

写语音识别Python SDK文档的百度出来的产品经理好好反省下!真垃圾!闲惯了不干事!

收藏
点赞
2
个赞
共12条回复 最后由用户已被禁言回复于2022-04
#14用户已被禁言回复于2019-09
#12 kingangelTOT回复
音频有30秒 结果只识别出来一句话,而且还是错的离谱, 垃圾

您的音频是否符合文档中的要求呢?支持的语音格式
原始 PCM 的录音参数必须符合 16k 采样率、16bit 位深、单声道,支持的格式有:pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)。

0
#12kingangelTOT回复于2019-09

音频有30秒 结果只识别出来一句话,而且还是错的离谱, 垃圾

0
#11用户已被禁言回复于2019-04
#9 cuilaixi回复
完完全全按照要求来的。坑的一笔。已转用腾讯ai语音识别。百度的语音技术肯定更强,但是文档为什么写的这么差?耽误多少事?
展开

16k 采样率、16bit 位深、单声道。确保符合这个条件。

0
#10用户已被禁言回复于2019-04
#9 cuilaixi回复
完完全全按照要求来的。坑的一笔。已转用腾讯ai语音识别。百度的语音技术肯定更强,但是文档为什么写的这么差?耽误多少事?
展开

您其实只要改一下音频格式就可以识别了。您的错误码在文档里也是有的。3312,在底部或者您搜索一下。

0
#9cuilaixi回复于2019-04
#8 用户已被禁言回复
请保证您从微信中获取的语音文件符合以下格式要求。 支持的语音格式 原始 PCM 的录音参数必须符合 8k/16k 采样率、16bit 位深、单声道,支持的格式有:pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)。 另外,推荐使用16K采样率的 PCM 格式音频。
展开

完完全全按照要求来的。坑的一笔。已转用腾讯ai语音识别。百度的语音技术肯定更强,但是文档为什么写的这么差?耽误多少事?

1
#8用户已被禁言回复于2019-04
#7 cuilaixi回复
amr,在微信发语音的一个文件。

请保证您从微信中获取的语音文件符合以下格式要求。

支持的语音格式
原始 PCM 的录音参数必须符合 8k/16k 采样率、16bit 位深、单声道,支持的格式有:pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)。

另外,推荐使用16K采样率的 PCM 格式音频。

0
#7cuilaixi回复于2019-04
#6 用户已被禁言回复
请问您识别的音频文件格式是什么?

amr,在微信发语音的一个文件。

0
#6用户已被禁言回复于2019-04
#5 cuilaixi回复
开始按照文档写这段# 读取文件 def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read() # 识别本地文件 client.asr(get_file_content('audio.pcm'), 'pcm', 16000, { 'dev_pid': 1536, })       报错 bogon:Desktop 11002147$ /usr/local/var/pyenv/shims/python /Users/11002147/Downloads/py_aiplat_demo/demo/baiduaiasr.py {'err_msg': 'param format invalid.', 'err_no': 3312, 'sn': '43141243141555056089'} 然后按照github写https://github.com/Baidu-AIP/speech-demo/blob/master/rest-api-asr/python/asr_raw.py这段,报错 {'access_token': '24.bed894e5cbf073604c0f14e75110ff0d.2592000.1557651030.282335-15803531', 'session_key': '9mzdWT/fLDko/KZ2UOzLMdQl12EYWXTksOiyzZrfjppJrdgFtuD0Ti/wSJj3QLvawJ89WDeJEnsToLSv/aWu/2xwmztGrQ==', 'scope': 'brain_enhanced_asr audio_voice_assistant_get audio_tts_post public brain_all_scope wise_adapt lebo_resource_base lightservice_public hetu_basic lightcms_map_poi kaidian_kaidian ApsMisTest_Test权限 vis-classify_flower lpq_开放 cop_helloScope ApsMis_fangdi_permission smartapp_snsapi_base iop_autocar oauth_tp_app smartapp_smart_game_openapi oauth_sessionkey smartapp_swanid_verify smartapp_opensource_openapi', 'refresh_token': '25.30f14fc2bf5aef68801a001ceb21227c.315360000.1870419030.282335-15803531', 'session_secret': '51c504a912c6525e8c6342a3c1601c9d', 'expires_in': 2592000} SUCCESS WITH TOKEN: 24.bed894e5cbf073604c0f14e75110ff0d.2592000.1557651030.282335-15803531 ; EXPIRES IN SECONDS: 2592000 url is http://vop.baidu.com/server_api?cuid=123456PYTHON&token=24.bed894e5cbf073604c0f14e75110ff0d.2592000.1557651030.282335-15803531&dev_pid=1536 header is {'Content-Type': 'audio/amr; rate=16000', 'Content-Length': 5045} Request time cost 0.025776 {"err_msg":"param format invalid.","err_no":3312,"sn":"427061603791555059030"}
展开

请问您识别的音频文件格式是什么?

0
#5cuilaixi回复于2019-04

开始按照文档写这段# 读取文件 def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read() # 识别本地文件 client.asr(get_file_content('audio.pcm'), 'pcm', 16000, { 'dev_pid': 1536, })       报错

bogon:Desktop 11002147$ /usr/local/var/pyenv/shims/python /Users/11002147/Downloads/py_aiplat_demo/demo/baiduaiasr.py

{'err_msg': 'param format invalid.', 'err_no': 3312, 'sn': '43141243141555056089'}

然后按照github写https://github.com/Baidu-AIP/speech-demo/blob/master/rest-api-asr/python/asr_raw.py这段,报错

{'access_token': '24.bed894e5cbf073604c0f14e75110ff0d.2592000.1557651030.282335-15803531', 'session_key': '9mzdWT/fLDko/KZ2UOzLMdQl12EYWXTksOiyzZrfjppJrdgFtuD0Ti/wSJj3QLvawJ89WDeJEnsToLSv/aWu/2xwmztGrQ==', 'scope': 'brain_enhanced_asr audio_voice_assistant_get audio_tts_post public brain_all_scope wise_adapt lebo_resource_base lightservice_public hetu_basic lightcms_map_poi kaidian_kaidian ApsMisTest_Test权限 vis-classify_flower lpq_开放 cop_helloScope ApsMis_fangdi_permission smartapp_snsapi_base iop_autocar oauth_tp_app smartapp_smart_game_openapi oauth_sessionkey smartapp_swanid_verify smartapp_opensource_openapi', 'refresh_token': '25.30f14fc2bf5aef68801a001ceb21227c.315360000.1870419030.282335-15803531', 'session_secret': '51c504a912c6525e8c6342a3c1601c9d', 'expires_in': 2592000}

SUCCESS WITH TOKEN: 24.bed894e5cbf073604c0f14e75110ff0d.2592000.1557651030.282335-15803531 ; EXPIRES IN SECONDS: 2592000

url is http://vop.baidu.com/server_api?cuid=123456PYTHON&token=24.bed894e5cbf073604c0f14e75110ff0d.2592000.1557651030.282335-15803531&dev_pid=1536

header is {'Content-Type': 'audio/amr; rate=16000', 'Content-Length': 5045}

Request time cost 0.025776

{"err_msg":"param format invalid.","err_no":3312,"sn":"427061603791555059030"}

0
#4cuilaixi回复于2019-04
#2 用户已被禁言回复
您好,你能给一下完整的报错日志吗?目前语音识别Python SDK是可以正常运行的。
展开

开始按照文档写这段# 读取文件 def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read() # 识别本地文件 client.asr(get_file_content('audio.pcm'), 'pcm', 16000, { 'dev_pid': 1536, })       报错

bogon:Desktop 11002147$ /usr/local/var/pyenv/shims/python /Users/11002147/Downloads/py_aiplat_demo/demo/baiduaiasr.py

{'err_msg': 'param format invalid.', 'err_no': 3312, 'sn': '43141243141555056089'}

然后按照github写https://github.com/Baidu-AIP/speech-demo/blob/master/rest-api-asr/python/asr_raw.py这段,报错

0
#3cuilaixi回复于2019-04

开始按照文档写这段# 读取文件 def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read() # 识别本地文件 client.asr(get_file_content('audio.pcm'), 'pcm', 16000, { 'dev_pid': 1536, })       报错

bogon:Desktop 11002147$ /usr/local/var/pyenv/shims/python /Users/11002147/Downloads/py_aiplat_demo/demo/baiduaiasr.py

{'err_msg': 'param format invalid.', 'err_no': 3312, 'sn': '43141243141555056089'}

然后按照github写https://github.com/Baidu-AIP/speech-demo/blob/master/rest-api-asr/python/asr_raw.py这段,报错

0
#2用户已被禁言回复于2019-04

您好,你能给一下完整的报错日志吗?目前语音识别Python SDK是可以正常运行的。

0
TOP
切换版块