IOS-语音合成遇到奇怪的bug
在用百度语音合成的时候,我们限定每次只合成350个字符长度,基本上都是合成成功的,但如果遇到开头两字是“咳嗽”的时候,字符长度就只能限定在340个左右,否则就会失败,这是为什么呢?...
语音合成和语音识别的libs有冲突吗
我先做好了语音识别的demo,然后我又在这个demo的基础上做语音合成,我按照步骤把语音合成的libs文件放到demo的libs后,原来的语音识别不能用了,求解,是怎么回事,怎么解决这个问题...
Paddle支持梯度检查点吗?
基本思想是只将一些节点的中间结果保存为CheckPoint,在反向传播过程中对这些节点之间的其他部分重新计算。据发明这个技巧的人说可以10倍大的模型放到GPU上,而计算时间仅仅增加20%...
人脸属性分析(年龄和性别)
我想了解一下百度智能云那个api他用的是什么算法估计的年龄和性别啊,或者说建立在哪种算法的基础上,找了好多资料都没有……救救孩子吧,感谢了...
请问一下语音识别为什么不支持MP3格式?
不是太明白,这是基于什么样的考虑呢?
如果支持mp3等格式的话开发者的工作会少很多,
有些应用场景只有mp3格式,
就还需要单独配置一台转码服务器进行转码。...
【AI达人养成营】第一周 作业笔记
第一节课在了解python的基础上做了点小工作。
对我来说最重要的是掌握了在线敲代码的流程,这是我继leetcode之后第二个在线敲代码的网站。但这个网站功能更齐全,还送了算力,真香。...
有关训练的问题
使用基线方法训练至第10个Epoch左右在验证集中准确率达到1,是我的计算方式出现问题了吗,这样如何判断优化后模型的性能改变呢,还是说通过每天提交测试得到性能评价。...
天气预报什么时候可以准一点?
能达到100%?
收集大量与大气层、地球表面有关的数据,比如温度、湿度、风力状况,这是现代天气预报的基础。在数据之间存在误差,那就需要用已有...
请问paddle能不能供C#调用
刚接触深度学习,目前是某软件公司员工,使用c#编程,公司有基于C#的完整的产品,所以不可能去转向phton,所以请问能不能与c#融合或者有接口供c#来进行调用,这样既有产品就不需要调整,谢谢!...
AI studio环境切换卡住了怎么办?
感觉这个问题一直都有。我先用基础版环境编写代码,然后跑代码的时候想直接切换到高级版。之后就一直卡在切换页面上:关闭旧环境----> 同步文件----->启动新环境, 然后就一直卡在第二步。...
票据识别中变化文字错位如何处理
标准票据可以使用三方的发票识别或者自定义模板识别来处理,但一些票据在打印时客观存在偏移的问题,基于这种情况像百度的自定义识别能否处理呢
...
每次检索都会返回所有记录的结果?
入库了100多张图,每次检索,都是返回100多条记录,按置信度排序的,置信度低于一定数值,基本山确定是没有意义的数据,随着图片数量的增加,到达万级之后,效率不就特别低了吗?...