求入手教程
刚入手多模态深度学习,小白一枚。请问这方面有什么合适的基础教程吗?
智能创作平台2.0
能力
1)多模态创作:通过文章内容分析,多模态技术可自动进行文本关键信息提取并生成解说文,同时使用语音合成技术完成配音,并自动抓取与内容...
唤醒词不能从pcm文件中识别?
唤醒功能只能使用mic作为声音源吗?不能从pcm或wav格式的文件中识别吗?
录了一段录音,保存为wav或pcm文件,里面有唤醒词...
为什么我查看的API不太全
这种形式查看接口说明吗?那在我不清楚具体细节时我想要直接去查找一个方法怎么办。
请问有其他办法吗?
...
关于Cityscapes数据集的问题
是 _gtFine_labelIds.png 是 35类吗?_gtFine_labelTrainIds.png 是21类吗?
我应该用哪一种?还是通过改变...
关于SENet的疑惑?
elementwise_mul 为什么 axis = 0 ? axis = 0不就代表着【n,c,h,w】中的 n 吗? 不应该是在 通道c 的维度相乘吗? axis = 1?...
如何只集成在线语音识别的so文件
not load so library,无法识别语音)
在1的时候,可以放着这个错误不管它吗??还有其他尽量减少打包apk大小的办法吗?
...
人工智能+教育2018发热
、核心素养、学业质量及实施评价等多个方面进行了大幅的修订和补充,对我国的新时代人才培养指明了新方向,也为智慧教育推动信息技术和教育实践的深度融合...
百度AR带你体验虚拟与现实的叠加世界
是如何来进行营销的?在潜在目标人群产生需求后,AR尽可能减少了传统信息传递的过程,通过把品牌/产品信息具象化,将产品真实再现的体验感觉传递...
query识别讲解及常见问题处理
只介绍整个识别过程中可看到的数据,不涉及具体的技术,目的是了解语句是如何识别以及query识别不符合预期之后该怎么检查与调整。
识别...
计算机视觉和自然语言处理哪个好
计算机视觉与自然语言处理,这两个都好,并且有种互相交融联合建模的趋势。在我们人类获取的信息中,视觉占90%,听觉占9%,其他占1%。但是...