微信小程序语音识别服务搭建全过程解析
文件大小,供参考:录音10秒钟,silk_v3大约是10kB大小,16k单通道48k编码的mp3大约是60kB大小。老接口录音更节约流量...
项目全流程笔记
1. 数据集准备
根据自己任务去寻找合适的数据集,e接着进行对应数据的标注,如果是目标检测的,需要将图片放在JPEGImages文件夹唉...
坐席上一状态超过20min,则状态无法变更
坐席变更状态时,若上一状态持续时长超过20min,则状态无法变更。状态变更方法封装在华为平台提供的AISoftPhoneV6.DLL插件中,请各位大佬解囊相助,在线等,急!...
视频语言字幕
你们百度有没有一款,可以做视频录制时,可以边录制,边显示语言内容的文字,即是我在用视频录制软件时,讲的话自动转为字幕,并跟上讲话节奏,在视频中显示。...
数字丢失问题很严重
数字丢失问题很严重,特别是0和2。
对于识别证件号码和数字内容的任务影响及其严重。
关于竞赛提交结果
://ai-studio-static.bj.bcebos.com/script/submit.sh
!sh submit.sh 结果文件路径 token
竞赛必须通过AI studio的notebook来提交嘛?
...
词曹识别错误问题
词曹中包含三个药品,提问数据三个药品是连在一起写的,为什么会识别成一个药品,词曹文件中没有这个值...
tts初始化报-204
今天使用百度的语音合成一直报错204 os文件没问题 导入的dat也没报错 有没有遇到相同错误的 给回答一下
...
语音合成,离线合成返回值非0
(-111)offline engine synthesize result not 0[(11)],断网的情况下一直提示这个错误。别告诉我设置不对,文件不对,我都检查了,也打印log显示正确,依然不行。...