模型,最好是关于语音识别的
?
不太明白你的意思
大佬,我现在遇到一个问题就是语音识别,一连串的语音按分类问题处理的话,那应该对应一个一维数组,还是把语音的声音进行截取,让其截取的语音与一个字相对应??????越说越乱
先用语音模型将字分类好后,再用语言模型进行整句识别。
还是这文里的说法。
https://blog.csdn.net/chinatelecom08/article/details/82557715
你观察现在的语音文字输入,都是先一个一个字识别,显示出来意思一般都路唇不对马嘴,然后再用语言模型更正成“人话”。比如微信输入就是。
我问一下,在训练语音模型的时候,是将一整句话喂进模型,然后对应还是将一整句话拆分成每个字,再讲每个字与其对应呀??
我觉着啊,语音模型和语义模型是可以分着训练的。都可以用预训练模型,然后用多任务学习聚合在一起。语义可以用ernie、bert之类的。语音识别的深度学习预训练模型应该也有吧。我没怎么玩过深度学习的语音识别。最好问问大佬。
麽~还是需要自己找的,
找了好长时间,找不到一个特别好的
求各位大佬解答难题
开源模型不多,论文还是有的。
大概明白了
这个我不太熟 直观上觉得还是前一种方法比较好
模型都是根据具体问题去优化的吧
就是关于语音识别的吧,识别整串句子的
小白,苦于没有例子而寸步难行
找找书看,书写的还是比较详细的。
飞桨模型库里有个deepasr,不过是用LSTM
https://www.paddlepaddle.org.cn/modelbasedetail/deepasr
挺好,不过这个可以看到内部结构吗
模型库是开源的。
?
不太明白你的意思
大佬,我现在遇到一个问题就是语音识别,一连串的语音按分类问题处理的话,那应该对应一个一维数组,还是把语音的声音进行截取,让其截取的语音与一个字相对应??????越说越乱
先用语音模型将字分类好后,再用语言模型进行整句识别。
还是这文里的说法。
https://blog.csdn.net/chinatelecom08/article/details/82557715
你观察现在的语音文字输入,都是先一个一个字识别,显示出来意思一般都路唇不对马嘴,然后再用语言模型更正成“人话”。比如微信输入就是。
我问一下,在训练语音模型的时候,是将一整句话喂进模型,然后对应还是将一整句话拆分成每个字,再讲每个字与其对应呀??
我觉着啊,语音模型和语义模型是可以分着训练的。都可以用预训练模型,然后用多任务学习聚合在一起。语义可以用ernie、bert之类的。语音识别的深度学习预训练模型应该也有吧。我没怎么玩过深度学习的语音识别。最好问问大佬。
麽~还是需要自己找的,
找了好长时间,找不到一个特别好的
求各位大佬解答难题
开源模型不多,论文还是有的。
大概明白了
这个我不太熟 直观上觉得还是前一种方法比较好
模型都是根据具体问题去优化的吧
就是关于语音识别的吧,识别整串句子的
小白,苦于没有例子而寸步难行
找找书看,书写的还是比较详细的。
飞桨模型库里有个deepasr,不过是用LSTM
https://www.paddlepaddle.org.cn/modelbasedetail/deepasr
挺好,不过这个可以看到内部结构吗
模型库是开源的。