首页
版块
访问AI主站
登录
百度账号登录
Github账号登录
注册
发帖
ninacobrev
0帖子
·
2回复
2
积分
积分商城
0
获赞
Ta的动态
Ta的帖子
Ta的回复
录制的语音格式是什么? PCM 还是 MP3 ? 录制完成后保存的本地路径 是哪里?
Ta的回复 :fang4096: 没有文件路径,语音数据通过回调返回,格式是PCM。 回复fang4096:数据用NSFileHandle拼起来,播放不了呀
3
ios 语音识别 录音数据拼接的文件无法播放
Ta的回复 :一直没人回是什么鬼,百度就是这么做开放平台的? 顺便吐槽下:SDK写的真是很难用,UI和核心的代码耦合在一起,对于我这种不需要UI的来说,需要引一堆没用的东西(建议百度的同学看看科大讯飞的SDK,对比下就知道差距了),另外离线引擎加载后内存暴增到84m,猜测是不是把所有语言的语音模型都放在s_文件里了,如果我只需要识别英文,是不是浪费了很多不必要的内存呢 最后说一下解决方案: 使用AudioFile进行文件的写入,在NewRecordData里,调用AudioFileWriteBytes拼接数据 (另外NewRecordData的线程居然跟其他的枚举的线程不一样)
2
切换版块
操作指南
常见问答
平台公告
经验交流
技术专区
文字识别
人脸识别
语音技术
PaddlePaddle
EasyDL
BML
EasyData
AI Studio
UNIT
人体分析
图像搜索
图像识别
内容审核
自然语言处理
机器人视觉
视频技术
增强现实
知识图谱
智能创作
智能呼叫中心
文心
EdgeBoard
DuerOS
EasyEdge
度目硬件
百度AI市场
Doris
AI赛事
百度之星大赛
AI Studio人工智能竞赛
语言与智能技术竞赛
千言数据集
集思广益
共享工具
头脑风暴
成果展示
智能客服