首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
如何准确识别手机本地通讯录人名
我现在想将手机本地通讯录上传,然后通过在线识别增加识别准确率,但是没找到相关接口实现
百度语音识别离在线融合SDK iOS版,静态库编译报错
百度语音识别离在线融合SDK iOS版,静态库编译报错,我换上在线识别的静态库编译通过但是运行久崩了。 这是什么原因呢?是静态库有问题吧?...
android离在线语音识别Demo在有线网络的情况下无法使用
提示: 识别失败:网络问题:2 EVENT_ERROR,#2,Other network related errors.. network...
卡证类文字识别后结构化输出的思路有哪些呢?
使用PaddleOCR已经可以进行图片中的文字识别了,但是对于一些特定场景,例如识别身份证正面中的6种关键信息并结构化输出,一般的思路是什么呢? ...
医疗行业的,需要识别照片里的人的舌头,有没有好办
需要调用识别功能,识别出舌头是否伸出了嘴外,各位专家有没有什么好的建议如何做比较准确。 
表情识别有什么开源数据集可以使用
最近在尝试训练人脸表情识别模型,请问有什么比较靠谱的表情识别标注数据可以使用呢
增值税发票识别的12位发票代码只有10位
调用增值税发票识别接口识别出来的12位发票代码,输出只有10位。导致提取的4要素准确率非常低。请问可以优化吗?...
语音合成和语音识别一起使用时出现了问题
如题,当语音识别出结果使用语音合成朗读后,麦克风功能被关闭了,这个怎么解决,朗读后,语音唤醒和语音识别都无效啦 ...
请问你们有没有语音识别离线库私有云部署的方案
请问你们有没有语音识别离线库私有云部署的方案,购买你们的语音识别库,部署我们自己的服务器
安卓开发中是否可以同时使用语音识别和语音融合
新建应用的时候识别和融合只能选取一项,我的任务想要做一个语音助手,既有语音的识别,也需要使用到语音的合成输出,...
语音识别和语音合成,整合到一个项目出问题
语音识别和语音合成,整合到一个项目出问题: 首先语音合成是完全没问题的,然后如果把语音识别,会出现下面日志错误,请大神指教,看不懂,为啥? ...
付费寻求大神做表格线框内文字的OCR识别
付费寻求大神能做通用的表格线框内文字的OCR识别,比如人员简历(线框可能粗细不一,清晰度也略微有差异),识别出每个框内的文字。...
短语音识别接口,遇到长音频怎么处理?
,这时候是不是会想到转文本的功能呢?其实这里就使用到了一个很重要的科技技术——语音识别。语音识别广泛应用于生活的各种领域内,比如手机中的语音...
百度做了一个流浪猫庇护所,用人工智能来判断疾病
),流浪猫的生存条件非常糟糕。平均只有40%的流浪猫能熬过冬天。庇护所在门口描猫的脸时,摄像头显然还能检查猫的疾病,并通过识别耳朵上的标签来...
android语音识别时使用api(添加监听器)的方式和识别器这两种方式的优缺点是什么?初学者用哪一种好一些?哪一种的功能强大一些?
如题目所述:android语音识别时使用api(添加监听器)的方式和识别器这两种方式的优缺点是什么?初学者用哪一种好一些?哪一种的功能强大...
【人脸识别】H5人脸识别实例系列一(人脸检测)
(。・∀・)ノ゙嗨咯,Everyone~  今天给大家带来的是 windows平台下,如何通过H5页面实现人脸识别的功能呢,一起探索...
如何在有限算力下实现智能驾驶多任务高精度识别
。为了使智能驾驶更安全更可靠,实现高精度、实时感知周围环境的技术至关重要,该技术不仅可以精准快速地识别车道线、行驶区域、行人、车辆等,而且将车...
【百度大脑CV主题月征稿计划】表格文字识别
一、功能介绍 对图片中的表格文字内容进行提取和识别,支持识别完整框线表格、含合并单元格表格或无框线表格,并可选择以JSON或Excel形式...
通用文字识别detect_direction困惑
有个情况让人感到很困惑,我使用百度OCR通用文字识别功能basicGeneral识别本地一个正常的图片(如下所示)如果不检测图像朝向可以...
为什么语音识别Demo的API_Key和Secret_Key是空的还能进行识别呢?我开发的应用的API_Key和Secret_Key是不是必须得填写呢?
为什么语音识别Demo的API_Key和Secret_Key是空的还能进行识别呢?我开发的应用的API_Key和Secret_Key是不是必须得填写呢?...
切换版块
智能客服