首页 Paddle框架 帖子详情
语音识别模型
收藏
快速回复
Paddle框架 问答深度学习 3389 26
语音识别模型
收藏
快速回复
Paddle框架 问答深度学习 3389 26

谁有好的基于paddle的语音识别模型???做这方面的人很少吗?怎么搜不到

0
收藏
回复
全部评论(26)
时间顺序
MLTcola
#2 回复于2020-04

求大神指点迷津

0
回复
水水水的老师
#3 回复于2020-05

的确是

0
回复
水水水的老师
#4 回复于2020-05

语音识别模型还是很少的

0
回复
MLTcola
#5 回复于2020-05
的确是

在查了好多资料,也没有几个像样的模型

0
回复
MLTcola
#6 回复于2020-05
语音识别模型还是很少的

大佬,你做过这方面的研究吗?

0
回复
AIStudio810258
#7 回复于2020-05

看看这个文对你有帮助没

https://blog.csdn.net/chinatelecom08/article/details/82557715

0
回复
AIStudio810258
#8 回复于2020-05

这里面直接就将语谱图当成图片输入进cnn网络了,然后用字做分类标签。

0
回复
AIStudio810258
#9 回复于2020-05

传统的玩法都是用梅尔倒谱系数做变换,然后提取峰值功率点进行比对。现在有了dl就直接用语谱图干了。

0
回复
AIStudio810258
#10 回复于2020-05

以前还用动态时间规整(DTW)增强字发音长度的鲁棒性,现在有了dl,都由cnn干了

0
回复
MLTcola
#11 回复于2020-05
这里面直接就将语谱图当成图片输入进cnn网络了,然后用字做分类标签。

有关于CNN的成熟的语音识别的结构没

0
回复
AIStudio810258
#12 回复于2020-05
MLTcola #11
有关于CNN的成熟的语音识别的结构没

深度学习的语音识别我也没怎么玩过。现在智能音箱满天飞,那些背后的模型算不算成熟。或者开源么。还得问大佬啊。

0
回复
AIStudio810260
#13 回复于2020-05
深度学习的语音识别我也没怎么玩过。现在智能音箱满天飞,那些背后的模型算不算成熟。或者开源么。还得问大佬啊。

智能音箱你可以看UNIT的视频课,其实感觉语音识别用得不是太深,主要是NLP和配规则。

0
回复
AIStudio810258
#14 回复于2020-05
智能音箱你可以看UNIT的视频课,其实感觉语音识别用得不是太深,主要是NLP和配规则。

嗯,这个主要是看做哪个层面的开发。如果是应用层面的开发,不但底层的语音识别(包括方言)细节不用操心,甚至nlp也有框架给做好了,其更像是前端开发。

0
回复
MLTcola
#15 回复于2020-05
深度学习的语音识别我也没怎么玩过。现在智能音箱满天飞,那些背后的模型算不算成熟。或者开源么。还得问大佬啊。

现在语音模型开源的很少呀,太难了

0
回复
AIStudio810260
#16 回复于2020-05
MLTcola #15
现在语音模型开源的很少呀,太难了

数据集也很少啊

0
回复
AIStudio810258
#17 回复于2020-05
数据集也很少啊

语音识别尤其是智能音箱、语音助手都是大佬们把持着呢,前景广阔。同学们研究出成果基本也都是“货卖帝王家”吧。

0
回复
AIStudio810260
#18 回复于2020-05
语音识别尤其是智能音箱、语音助手都是大佬们把持着呢,前景广阔。同学们研究出成果基本也都是“货卖帝王家”吧。

测试过开源的数据集和算法,实际应用效果很差,几乎一句话都不能完整识别出来,感觉数据集的原因比较大。

0
回复
MLTcola
#19 回复于2020-05
测试过开源的数据集和算法,实际应用效果很差,几乎一句话都不能完整识别出来,感觉数据集的原因比较大。

可能也是网络不够深

0
回复
MLTcola
#20 回复于2020-05
语音识别尤其是智能音箱、语音助手都是大佬们把持着呢,前景广阔。同学们研究出成果基本也都是“货卖帝王家”吧。

现在才知道语音识别难呀,以前年纪小不懂事

0
回复
AIStudio810258
#21 回复于2020-05
测试过开源的数据集和算法,实际应用效果很差,几乎一句话都不能完整识别出来,感觉数据集的原因比较大。

嗯,工业用的的根比赛研究用的数据集应该完全不是一回事吧。

0
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户