提交数据的格式
1、结果文件是用"\t"分割的吗
2、需要包含 title "index\tprediction"吗
运行APP就奔溃,虚拟机重启
/com.jetway.facegate.activity.FaceQRCodeActivity t114}: app died, no saved...
百度语音合成方法无法调用问题
那个Demo中的speak方法,当时speak方法没有声音发出。
有尝试过直接编译Demo,speak方法是可以的,但是同一个包中的其他类...
如何实现对语音的打分?
又分为两种情况:
1、评分完全有AI系统自主判断,没有任何参照。
2、上传对应文本的标准真人发音,以此为参照,AI给出用户发音的评分。
请问百度的语音处理服务有没有这样的服务,我翻了一遍没找到,如何实现这样的功能?
...
语音合成和语音识别同时进行,导致识别不准确
截图能帮助您更快解决问题):
复现步骤、现象及其他描述:
在进行语音合成(例如:读一段文字),这个时候启用语音识别,把合成的声音和人说的声音混一起了,这种情况如何处理呢...
Parakeet TTS 旋律问题
话说前面有可以克隆声音的模型(个人用tacotron2),那我在想,能不能有个在tts更上一层楼的操作,让输出的声音有旋律,但是在...
降维算法
较有代表性的是t-SNE。t-SNE算法的基本思想是:用t分布取代SNE中的高斯分布,使得降维后的数据,同类之间更加紧凑,不同类之间距离加大...
【AI达人训练营】学习笔记
;*data.npy 文件通过 np.load() 读取后,会得到一个形状为 N×C×T×V×M 的五维张量
数据预处理:将 2922 个...
'gbk'问题 如何解决
UnicodeDecodeError: 'gbk' codec can't decode byte 0x81 in position 22: illegal multibyte sequence