首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
【在线等】粤语语音输入,通话文本输出,支持嘛?
现在有个需求,需要识别粤语语音,但是目前看到识别出来的结果还是粤语发音的文本。难道不支持转换为通话的文本嘛?求支持 ...
下载训练好的模型失败
训练好的模型大1Gb,每次下载都是下载到几十m就网络连接中断,更换网络和浏览器都不能解决问题
咨询一下语音唤醒和远场拾音问题
 咨询一下, http://ai.baidu.com/tech/speech/fsr 大啥时候开放?是提供算法?还是硬件了? 然后就...
在线http语音流的实时识别,有对应接口吗?
半年前咨询过http语音数据流的实时识别,当时得到的答复是API正在排期,不知道现在是否已经有了?
目标检测疑问
对于目标检测加分类的深度学习问题,所分的类又100多种,一张图上出现的目标三种,大伙儿更推荐YOLOv3还是SSD呢,?...
中美AI竞争愈加胶着 百度为中国再增胜算
文表示,美国将越来越担忧中国日益增长的技术实力。由于中国庞大的市场,一旦中国企业研发出与美国企业接近的技术和产品,其潜在市场将会比美国...
stem_channels是什么意思呢,跟通的channels区别是什么呢
stem_channels是什么意思呢,跟通的channels区别是什么呢,为什么默认值为(16,24,32,48)呢?
调用语音识别 只要用通话 返回的就是aStatus
调用语音识别 只要用通话 返回的就是aStatus就是用户说话完成,但服务器尚未返回结果
发布到服务器出现api调用问题,请求指点感激!!
我本地Windows测试没问题,放到Linux服务器出现问题。只要上传的图片大超过1M,代码就会卡住,我测试发现卡在AipHttpClient中。具体位置见图片。有没有大神解答一下。感激不尽。...
分享一篇自动寻解超参数的文章。
丰富,学习效率高。我想美国人研究后说中国人有学数字的“单音节读音”红利,所以大众数学更好一些。同样的逻辑-美国人是不是有论文母语红利呢?难怪施...
语音合成的声音总是比通mp3格式的音频播出来的音量小
语音合成的声音总是比通mp3格式的音频播出来的音量小,是什么原因,所有音量都已调到最大,SDK中的音量也设成最大了...
百度输入法用的ai技术通开发者可以用到么
如题,百度输入法最近发展迅速。其核心词库智能对词的方式,通开发者能使用吗?
人工智能体系如何在经济下行周期进行发力?
经济下行成了不争的时代事实,在这个过程中很多人都会迷茫也都会思考经济下行中一个通人应该如何实现自己的价值。去年的时候还在写着很多的优秀的项目,今年我只想着作为一个通人应该如何活下去。...
百度语音识别支持多语种的识别码?
只支持中文通话还是哪些语言识别呢
EasyDL近期精彩实例大盘点
距离,在美国纽约、新泽西、宾夕法尼亚等七个州的160个超市为了监测购物车下面是否有未付款商品,部署了总计1600个智能摄像头。这些摄像头...
量子计算机研发渐入佳境,AI会有什么变化?
英特尔1月8日在CES展会上宣布,向研究合作伙伴交付全新研制的49量子位测试芯片“Tangle Lake”,该芯片以美国阿拉斯加的湖泊命名...
发送启动监听命令之后有的时候很快,但有的时候不能唤醒或者是唤醒很慢
有的时候开启监听服务之后没有start/ready的回调,有时候只能收到一条; 唤醒有的时候反应比较快,有的时候很慢(大2分钟)或者没有反应; 可以通过频繁启动停止唤醒监听来复现 ...
aistudio项目insightface-paddle人脸识别率非常低如何调高呢
人脸检测部分是ok的,但是识别部分不行.上传了大5个人脸图片,然后一个测试图片,结果无法正确识别这张测试图片.请教大家指点下. 是否图片清晰度和尺寸有要求呢...
无法报名比赛
报名提交表单后,显示有工作人员联系,然后自动跳转AI训练营报名?,接着同意条报名AI训练营,然后提示补全个人信息,但是个人信息已经补全了,从而无法报名。大家是怎么解决的?...
模型训练完成后,可以在通服务器上运行吗?
我知道,模型训练需要的资源比较大,特别是GPU和内存。我想知道的是,模型训练完成后, 可以在通的服务器上面运行吗?比如4CPU,16G的云服务器。...
切换版块
智能客服