语音识别Python SDK文档写的真垃圾

首页版块访问AI主站注册发帖

cuilaixi 发布于2019-04 浏览:4421 回复:12

语音识别Python SDK文档写的真垃圾

快速回复

为什么按照描述跑不起来？一直报错param format invalid?

为什么腾讯的ai文档按照写就能跑起来？

写语音识别Python SDK文档的百度出来的产品经理好好反省下！真垃圾！闲惯了不干事！

智能语音助理

技术问答

文档

个赞

共12条回复最后由用户已被禁言回复于2022-04

#14用户已被禁言回复于2019-09

对#12 kingangelTOT回复

音频有30秒结果只识别出来一句话，而且还是错的离谱, 垃圾

您的音频是否符合文档中的要求呢？支持的语音格式
原始 PCM 的录音参数必须符合 16k 采样率、16bit 位深、单声道，支持的格式有：pcm（不压缩）、wav（不压缩，pcm编码）、amr（压缩格式）。

#12kingangelTOT回复于2019-09

音频有30秒结果只识别出来一句话，而且还是错的离谱, 垃圾

#11用户已被禁言回复于2019-04

对#9 cuilaixi回复

完完全全按照要求来的。坑的一笔。已转用腾讯ai语音识别。百度的语音技术肯定更强，但是文档为什么写的这么差？耽误多少事？

展开

16k 采样率、16bit 位深、单声道。确保符合这个条件。

#10用户已被禁言回复于2019-04

对#9 cuilaixi回复

完完全全按照要求来的。坑的一笔。已转用腾讯ai语音识别。百度的语音技术肯定更强，但是文档为什么写的这么差？耽误多少事？

展开

您其实只要改一下音频格式就可以识别了。您的错误码在文档里也是有的。3312，在底部或者您搜索一下。

#9cuilaixi回复于2019-04

对#8 用户已被禁言回复

请保证您从微信中获取的语音文件符合以下格式要求。支持的语音格式原始 PCM 的录音参数必须符合 8k/16k 采样率、16bit 位深、单声道，支持的格式有：pcm（不压缩）、wav（不压缩，pcm编码）、amr（压缩格式）。另外，推荐使用16K采样率的 PCM 格式音频。

展开

完完全全按照要求来的。坑的一笔。已转用腾讯ai语音识别。百度的语音技术肯定更强，但是文档为什么写的这么差？耽误多少事？

#8用户已被禁言回复于2019-04

对#7 cuilaixi回复

amr,在微信发语音的一个文件。

请保证您从微信中获取的语音文件符合以下格式要求。

支持的语音格式
原始 PCM 的录音参数必须符合 8k/16k 采样率、16bit 位深、单声道，支持的格式有：pcm（不压缩）、wav（不压缩，pcm编码）、amr（压缩格式）。

另外，推荐使用16K采样率的 PCM 格式音频。

#7cuilaixi回复于2019-04

对#6 用户已被禁言回复

请问您识别的音频文件格式是什么？

amr,在微信发语音的一个文件。

#6用户已被禁言回复于2019-04

对#5 cuilaixi回复

开始按照文档写这段# 读取文件 def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read() # 识别本地文件 client.asr(get_file_content('audio.pcm'), 'pcm', 16000, { 'dev_pid': 1536, }) 报错 bogon:Desktop 11002147$ /usr/local/var/pyenv/shims/python /Users/11002147/Downloads/py_aiplat_demo/demo/baiduaiasr.py {'err_msg': 'param format invalid.', 'err_no': 3312, 'sn': '43141243141555056089'} 然后按照github写https://github.com/Baidu-AIP/speech-demo/blob/master/rest-api-asr/python/asr_raw.py这段，报错 {'access_token': '24.bed894e5cbf073604c0f14e75110ff0d.2592000.1557651030.282335-15803531', 'session_key': '9mzdWT/fLDko/KZ2UOzLMdQl12EYWXTksOiyzZrfjppJrdgFtuD0Ti/wSJj3QLvawJ89WDeJEnsToLSv/aWu/2xwmztGrQ==', 'scope': 'brain_enhanced_asr audio_voice_assistant_get audio_tts_post public brain_all_scope wise_adapt lebo_resource_base lightservice_public hetu_basic lightcms_map_poi kaidian_kaidian ApsMisTest_Test权限 vis-classify_flower lpq_开放 cop_helloScope ApsMis_fangdi_permission smartapp_snsapi_base iop_autocar oauth_tp_app smartapp_smart_game_openapi oauth_sessionkey smartapp_swanid_verify smartapp_opensource_openapi', 'refresh_token': '25.30f14fc2bf5aef68801a001ceb21227c.315360000.1870419030.282335-15803531', 'session_secret': '51c504a912c6525e8c6342a3c1601c9d', 'expires_in': 2592000} SUCCESS WITH TOKEN: 24.bed894e5cbf073604c0f14e75110ff0d.2592000.1557651030.282335-15803531 ; EXPIRES IN SECONDS: 2592000 url is http://vop.baidu.com/server_api?cuid=123456PYTHON&token=24.bed894e5cbf073604c0f14e75110ff0d.2592000.1557651030.282335-15803531&dev_pid=1536 header is {'Content-Type': 'audio/amr; rate=16000', 'Content-Length': 5045} Request time cost 0.025776 {"err_msg":"param format invalid.","err_no":3312,"sn":"427061603791555059030"}

展开

请问您识别的音频文件格式是什么？

#5cuilaixi回复于2019-04

bogon:Desktop 11002147$ /usr/local/var/pyenv/shims/python /Users/11002147/Downloads/py_aiplat_demo/demo/baiduaiasr.py

{'err_msg': 'param format invalid.', 'err_no': 3312, 'sn': '43141243141555056089'}

然后按照github写https://github.com/Baidu-AIP/speech-demo/blob/master/rest-api-asr/python/asr_raw.py这段，报错

{'access_token': '24.bed894e5cbf073604c0f14e75110ff0d.2592000.1557651030.282335-15803531', 'session_key': '9mzdWT/fLDko/KZ2UOzLMdQl12EYWXTksOiyzZrfjppJrdgFtuD0Ti/wSJj3QLvawJ89WDeJEnsToLSv/aWu/2xwmztGrQ==', 'scope': 'brain_enhanced_asr audio_voice_assistant_get audio_tts_post public brain_all_scope wise_adapt lebo_resource_base lightservice_public hetu_basic lightcms_map_poi kaidian_kaidian ApsMisTest_Test权限 vis-classify_flower lpq_开放 cop_helloScope ApsMis_fangdi_permission smartapp_snsapi_base iop_autocar oauth_tp_app smartapp_smart_game_openapi oauth_sessionkey smartapp_swanid_verify smartapp_opensource_openapi', 'refresh_token': '25.30f14fc2bf5aef68801a001ceb21227c.315360000.1870419030.282335-15803531', 'session_secret': '51c504a912c6525e8c6342a3c1601c9d', 'expires_in': 2592000}

SUCCESS WITH TOKEN: 24.bed894e5cbf073604c0f14e75110ff0d.2592000.1557651030.282335-15803531 ; EXPIRES IN SECONDS: 2592000

url is http://vop.baidu.com/server_api?cuid=123456PYTHON&token=24.bed894e5cbf073604c0f14e75110ff0d.2592000.1557651030.282335-15803531&dev_pid=1536

header is {'Content-Type': 'audio/amr; rate=16000', 'Content-Length': 5045}

Request time cost 0.025776

{"err_msg":"param format invalid.","err_no":3312,"sn":"427061603791555059030"}

#4cuilaixi回复于2019-04

对#2 用户已被禁言回复

您好，你能给一下完整的报错日志吗？目前语音识别Python SDK是可以正常运行的。

展开

bogon:Desktop 11002147$ /usr/local/var/pyenv/shims/python /Users/11002147/Downloads/py_aiplat_demo/demo/baiduaiasr.py

{'err_msg': 'param format invalid.', 'err_no': 3312, 'sn': '43141243141555056089'}

然后按照github写https://github.com/Baidu-AIP/speech-demo/blob/master/rest-api-asr/python/asr_raw.py这段，报错

#3cuilaixi回复于2019-04

bogon:Desktop 11002147$ /usr/local/var/pyenv/shims/python /Users/11002147/Downloads/py_aiplat_demo/demo/baiduaiasr.py

{'err_msg': 'param format invalid.', 'err_no': 3312, 'sn': '43141243141555056089'}

然后按照github写https://github.com/Baidu-AIP/speech-demo/blob/master/rest-api-asr/python/asr_raw.py这段，报错

#2用户已被禁言回复于2019-04

您好，你能给一下完整的报错日志吗？目前语音识别Python SDK是可以正常运行的。

快速回复

小编推荐

百度大脑语音方向服务全面升级！

用户已被禁言 235.9K回复

语音识别「极速版」升级，支持小程序接入

用户已被禁言 1.6K回复

第三期【百度大脑新品体验】语音问答机器人小程序

wangwei8638 259.3K回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服