首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
AI 转型必看|算法工程师的 AI 启示录
过程。 当你走近 AI 架构师这扇门,你应该思考:如何站在业务系统的角度,找到业务最重要、最核心的问题?如何结合算法和工程经验,实现高效的...
强力推荐!飞桨产业级PaddleCV最新全景图
。使用者可以使用PaddleCV 快速实现图像分类、目标检测、图像分割、视频分类和动作定位、图像生成、度量学习、场景文字识别和关键点检测8...
CV计算机视觉-在线公开课即学即用
业务场景需求中,如何用EasyDL快速训练一个AI模型并快速落地应用。 课程包括三个部分内容 1、EasyDL的整体产品介绍、技术介绍及典型...
UNIT智能对话训练营启动,语音客服专场来了
。                                                                                                                                                                            如何...
【案例】山水兰德:人脸识别营造智慧安全社区
员进出管理,打造安防常态化管理体系,通过“以业管人、以房管人、以证管人、以信息化管人”的重要方式,真正做到对小区流动人口、车辆管理底数清情况,为...
【资讯】深度学习行业应用及就业方向大猜想
用了语音合成技术。 NLP-自然语言处理:但是只是语音技术还不够,理解指令才能对应做出操作。而理解指令、控制车辆,包括输出回复内容,都是...
如何将项目挂载的数据集移动至项目内
如题,纯新手,我已经将数据集挂载到了项目上,怎样做才能把数据集中的文件移动到项目的文件夹内呢
Text2SQL如何制作数据集,应该用什么工具标注
参考了官方训练集,发现"sql"字段的逻辑比较难标注,请问大家都是用什么工具生成的?
我编译百度语音Demo(linux c)出现如下所示错误,如何修正?
g++ -I./  -Wall -DFUNCTION_TEST -g -c sample.cpp -o sample.osample.cpp: In function ‘int main(int, char**)’:sample.cpp:57:18: warning: deprecated conversion from string consta...
android版在离线语音识别sdk速度太慢,如何让其只工作在离线模式
我使用的服务是: 调用的接口是: 参数设置情况: 开发平台和机型: SDK版本号: 代码或日志截图(上传截图能帮助您更快解决问题)...
如何处理通过合成REST_API得到的二进制语音数据
我使用的服务是:合成REST_API 调用的接口是: 参数设置情况: 开发平台和机型:python SDK版本号: 代码或日志截图(上传截图能帮助您...
请问识别的语音内容的长度超过了1分钟如何处理
我使用的服务是: 调用的接口是:识别-REST_API 参数设置情况:fcm格式音频时长超过了1分钟 开发平台和机型:Java平台 SDK版本号: 代码...
如何设置不对是否可以上网进行判断 完全离线使用
我使用的服务是: 调用的接口是: 参数设置情况: 开发平台和机型: SDK版本号: 代码或日志截图(上传截图能帮助您更快解决问题)...
如何注册企业开发者账号使用语音识别服务
我使用的服务是:百度语音识别 调用的接口是:识别_REST_API 参数设置情况:PCM 开发平台和机型:PYTHON SDK版本号:无 代码或日志截图(...
长时间音频如何进行分割,有没有好的长音频识别方案
百度语音好像不支持直接转换MP3格式的音频,而且即使是pcm格式的音频,最长不能超过60s, 现在我可以java实现把整段的MP3音频转换成pcm, ...
iOS应用管理如何根据报名来找到在TTS中已创建的应用
由于前同事标题起的有歧义,无法找到适当的应用来做相应的修改。问题也可以理解成怎么查看TTS中已创建应用的包名
百度离线语音包中dat文件如何使用?我想自己解析。
百度提供的离线语音dat文件,我在哪里可以找到该dat数据结构的介绍?dat文件中语音部分采用的是什么格式的语音内容?pcm还是wav?
在在线标注中,一个图片如何同一字段标注多个?
我想标注数码管显示的值,我一张图片上有多个数码管。如果可以同一图片,可以标注同一字段的多个不同值,可以大大提高标注效率 ...
切换版块
智能客服