首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
语音识别支持声纹识别
我使用的服务是:语音识别 调用的接口是: 参数设置情况: 开发平台和机型: SDK版本号: 代码或日志截图(上传截图能帮助您更快解...
语音识别有自动纠错功能
我使用的服务是: 调用的接口是: 参数设置情况: 开发平台和机型: SDK版本号: 代码或日志截图(上传截图能帮助您更快解决问题)...
语音合成支持英文的英式发音和美式发音
我使用的服务是: 调用的接口是:http://tsn.baidu.com/text2audio 参数设置情况: 开发平台和机型: SDK版本号: 代码或日志截图(上传截图能...
请问百度双目尺度精度测试过
我们发现尺度和真实值差距比较大,还不如单目的vins的vins.
ios的demo中内置UI可以更改图片
我使用的服务是: 调用的接口是: 参数设置情况: 开发平台和机型: SDK版本号: 代码或日志截图(上传截图能帮助您更快解决问题)...
现在有考虑加入动态词槽?
就比如单用户自己训练自己的词槽和语句.
手持身份证拍的照片,可以识别
大家好,有个需求,手持身份证拍的照片,如何识别其中的文字。
请问有用3050TI搭建环境的
我用的笔记本电脑是3050Ti,目前只能用5.1的驱动,导致cuda 版本在11.6,请问我是需要降驱动版本再降cuda版本,还是直接可以降cuda版本?
代码在运行时,可以切换模型
我用的时Python,在程序启动的时候进行初始化 ocr = PaddleOCR(use_angle_cls=False, det_model_dir=det_model, rec_model_dir=rec_model, use_mp=True, total_process_num=1,...
有辅助模型编排的框架
现在公司业务上有一个CV的需求, 比如imageNet有1000类,但是imageNet的图片的类别是有层次的,比如 动物 → 鸟 → magpie喜鹊 方案一:训...
接入unity 语音识别 录音数据回调处理 播放 有详细的解决办法 最好有代码
接入unity 语音识别 录音数据回调处理 播放 有详细的解决办法 最好有代码
我添加苹果的支持后台的那种模式,我们的app不是音乐播放,voip类的软件 ,苹果审核会通过
我添加苹果的支持后台的那种模式,我们的app不是音乐播放,voip类的软件 ,苹果审核会通过
做机器阅读理解csv数据集如何转化为squad格式,没人可以帮我一下
做机器阅读理解csv数据集如何转化为squad格式,没人可以帮我一下
语音识别rest api可以支持四川话
看介绍里面传入参数是有的,但是识别不了
请问UNIT包括语音识别
您好,之前试用过AIUI,他是支持语音识别的。我在UNIT文档中没看到相关说明,请问发布后是否支持语音识别?谢谢!
demo现在这么复杂,导入之后报错
Error:Error occurred while communicating with CMake server. Check log C:\Users\P\Desktop\baidu\Baidu_Face_Offline_SDK_Android_2.0\iminect\.externalNativeBuild\cmake\debug\armeabi-v...
平台的情感预测接口有用到ERNIE模型
听说百度自研的ERNIE模型在多项中文NLP任务超越了谷歌的BERT模型,不知道现在情感预测接口的后台是否已经应用了ERNIE模型?
切换版块
智能客服