首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
iOS 怎么实现实时pcm文件流的识
pcm文件是有UDP的形式接收到手机上。需要对接收到数据进行语音识,而且该文件不是完整给您,是以0.05ms 800个字节传到手机上。百度语音识该怎么做到实时识呢...
用 PaddleOCR 进行集装箱箱号检测识
%|██████████| 3003/3003 [00:00 00:00, 37908.32it/s] 4.2 识模型所需数据准备们根据检测...
在启动项目的情况下进项目,要停掉启动的项目
偶发问题,在启动项目的情况下进项目,要停掉启动的项目。。。
android的离线不可用,当断网或者网络不好的,无法发出声音?
android的离线不可用,当断网或者网络不好的,无法发出声音?什么问题?
语音合成后播放时使用的是铃声的音量,想用媒体的
语音合成后播放时使用的是铃声的音量,想用媒体的音量,是否有配置可以改变?
ASR远场识什么时候能支持自定义词库?
想看拳皇” 会被识别成 “想看全黄”“想看芳华” 会被识别成 “想看繁华” 类似这种问题, 远场识能否支持自定义词库?...
Win10+VS2019+CPU+cmake编译成功,但识率几乎没有
,两张图的识结果如下: 但是, 用python部署成功后,识率却是正常的,模型库就是用的(百度OCR...
OCR 识小工具(3)——营业执照识
功能介绍 可结构化识各类版式的营业执照,返回证件编号、社会信用代码、单位名称、地址、法人、类型、成立日期、有效日期、经营范围等关键字...
离线语音识不支持英文单词
离线语音识,不支持英文单词嘛,Demo切换到英文识,不可用
语音识,网络问题
语音识中,提示: 识失败:网络问题:2; EVENT_ERROR,#2,Other network related errors....
来科普一下】快丨三最厉害的回丨血导丨师—经典再现
着,走到果园边你会闻到一股诱人的味道。竿时山娃总爱窜进自家瓜棚里跟小伙伴们坐着聊天聊着聊着便忍不住往瓜田里逡巡一番抱起一只硕大的西瓜用石不...
OCR 识训练问题
数据, 准确率 才 hmean:0.4588428735733032 太低了,想 优化,他的配置文件,想优化参数都没有几个 ...
想识图片中的瓷盘容易,但是如何区分瓷盘颜色?
想识图片中的瓷盘容易,但是如何区分瓷盘颜色?瓷盘中可能装有物品。但从周边可以看到瓷盘颜色。 想识猫,但是想识猫的类型?   这是...
iOS调用OCR文字识SDK报错
报错,提示IdcardQuality.framework找不到。请问IdcardQuality.framework是必须添加的吗?项目中并不需要使用身份证识。 ...
为什么语音识返回curl_error:28错误
用自己解码出来的16bit,16k采样率、单声道的pcm文件进行语音识,返回curl_error_code:28的请求超时错误,但百度的监控上却显示调用成功。用百度提供的示例pcm文件就没有这些问题。...
UNIT 是否满足语音识和语音合成的功能需求?
语音合成代码 进行语音播报) 这个样例已经接入了 唤醒 + 识 + 合成,(代码实现逻辑就是,拿着识别后的文字去判断是否包含必要关键字,如果...
用自己的图片放入paddle做卷积为啥就不行
我从我的当前文件夹中读取5个图片。如果flatten放入fc,没问题有输出。放入卷积就报错,求大神指点。
票据识全新上线,节省录入成本
。   如果有任何问题,请随时与们联系,们将为您提供周全的服务。 合作咨询:ai@baidu.com 使用咨询:百度文字识QQ群-631977213...
语音识高级设置怎么用?
语音识高级设置(语音识别词库设置和语义解析设置)怎么用,已经上传了文件,但是在调用的时候没有相应的返回结果 ...
语音识保存录音输出格式
语音识别安卓离在线SDK: 1、语音识时录音的输出格式都支持哪些? 2、如果只支持PCM格式,那么需要怎么播放?...
切换版块
智能客服