首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
如何在anaconda环境中安装nccl2
有对应的anaconda安装nccl的安装教程? p.s. pytorch中不需要安装nccl也可以使用,是因为自带了吗?...
Windows离线语音识别服务端
众所周知,Windows的离线识别成品软件,真的超级超级难找!~微软那些提供训练的,准入门槛过高!~ 于是我开发了一个~有人感兴趣?GET或者POST就可以获取识别文本...
怎么进行多张图片的本地识别
在进行内容制作时,以前可以选择多张识别图,但是上传不同的识别图后,只能识别一张 现在是能上传一张,,,那么多张图片怎么识别?是制作多个AR资源包?一张图片一个资源包? ...
ocr将统一水平线的相隔很大的识别为一个文本
如图:   如最上排的“关闭”“我接收的”,“写周报”,百度的通用文字(不论哪种)识别都会识别为“关闭我接收的写周报”,就是说同一水平线上的文本会认为是一个,是有什么地方可以设置啊?...
如何只识别中间的人脸
现在百度人脸识别如果三个人并排的话是识别出脸比较大的那个.那如果我只想识别中间的人脸,可以做到?我用的是离线 sdk...
比较 GM (m,n) 和其他
大家好。 论坛里有懂off-white系统理论的(邓博士1982)? 也许有人比较了各种现代模型 GM 的准确性并可以分享他们的...
关于制作Tiny-pose训练用的coco数据集的一些问题
问题如下: 1.标注标签里可以有空格,比如"Left Eye".还是需要用'_'连接 2.labelme标注的关键点json文件怎么转换成coco数据集格式 请各位大佬能够指点一二,谢谢...
OCR高精度通用文字识别是否可以离线使用
OCR高精度通用文字识别是否可以离线使用?因公司合规要求,图片不能在非公司以外的网络内流转,请问是否可以使用百度的文字识别产品。谢谢!...
android语音唤醒能不能支持可以选择麦克风
android语音唤醒或者识别的时候,能不能支持可以选择的麦克风。比如我们使用麦克风的时候可以设置选择...
UNIT正则表达式增加中文汉字识别功能
:"?" "{n}" "{m,n}" ,其他正则表达式符号如:* + () ^ $ 等不支持, 如果不加反斜杠进行转义训练会失败 2、正则表达式和普通词可以在一个词槽文件中,正则表达式前面需要加$$$进行区分 ...
自然语言处理中【中文分词】技术【自动切分】的理解
把计算机数据转化成人类可以听懂的语言;而自然语言理解和产生的前提是对语言能够做出全面的解析,而在中文中,汉语词汇是语言独立运用的最小语言单位,因此...
关于clear_grad方法在训练中的作用
,在只写了optimizer.clear_grad()时,看样子不知为何训练不起来。 但加上对网络的clear_gradients()后就可以...
到时间发块近段时间福克斯的
在现场现在才出现在超限超载字符串在出租先出现在在现场现在才在池子才行常在线现在才
音频文件转写,文件格式问题
文件格式可以是.mp3的,调用上传都没问题,但是一直没有最后结果。 反馈一直是{'status': 50006, 'msg': '正在...
如何将使用save_dygraph接口保存的模型使用save_inference_model接口保存
"]) 这样保存的模型,可以使用 save_inference_model 接口保存成.pdmodel和.pdiparam格式的模型?...
concat未运行时强制检查报错
concat,concat编译时提示shape不对,但是在实际运行的时候是可以保证size对齐的,想问下在编译时就得得保证concat的所有feature map的size是一致的? ...
Paddle端部署
最近想把之前用PaddleDetection开发的一个CV项目部署到端上,各位大佬有什么好的建议,之前捣鼓PaddleDetection提高性能去了,没有试过部署,求大佬指点,如果有项目可以学习就更好啦~...
语音合成输出的音频格式问题
kHz, Monaural 请问可以输出wav格式?或者怎么转成wav格式啊?...
人脸识别技术求大佬开导
求问,有一个场景,50个人的课堂,若采用人脸识别技术,能否解决所有学生的签到?百度人脸识别技术的人脸数量限制可以突破?...
语音识别 REST API OPUS格式 返回3301
请问语音识别 REST API支持的opus格式是指ogg封装的opus?我用opus-tools-0.1.9-win32把一段手机...
切换版块
智能客服