百度AI开发者社区

Android语音识别sdk如何同时识别多个文件

/forum/topic/show/498086 2018-02-27

如题，因为同时只支持一个asr，但我们的需求是同时识别多个文件，如何使得IN_FILE有多个？

二〇二二年一月第二周精品项目公布

/paddle/forum/topic/show/993273 2022-01-13

://aistudio.baidu.com/aistudio/projectdetail/3260962作者昵称：所追寻的那座城项目名称：『领航团』人脸识别飞机大战项目链接...

基于Transformer的手语翻译模型文件缺失怎么办

/paddle/forum/topic/show/1917475 2023-02-08

/aistudio/projectdetail/4251806?channelType=0 channel=0 但发现没有transformer.pdparams这个文件，不知道要去哪里找，希望有大佬帮忙解答一下 ...

百度语言识别，怎么识别本地FLAC音频文件？

/forum/topic/show/494521 2016-07-09

从官方开发的SDK中没有找到怎么识别本地音频文件，例程都是直接从话筒识别的，请问一下是否需要在 public class Constant 中定义。谢谢？能给个代码参考一下最好了！！！！ ...

AI如何走向精智能之路？

/paddle/forum/topic/show/1911117 2022-09-24

源自：Science 9月20日消息，斯坦福大学一项新的研究表明，人工智能可以通过问一些看起来很愚蠢的问题来帮助它们变得更加聪明...

（付费求助）web端自动合成的语音文件如何自动播

/forum/topic/show/892802 2018-10-23

的音频文件（已实现），然后自动播放出这句话（未实现，付费求助如何自动播放）环境：B/S网页 953485331...

我调用文字识别的软件如何分客户

/forum/topic/show/497658 2018-01-23

我调用文字识别的软件需要给不同的客户，每个客户都需要获取自己私人的识别次数，有没有把不同客户各自的次数分开的方法。...

百度语音合成怎么保存文件，直接把返回的二进制保存为pcm文件不能用呢

/forum/topic/show/495321 2016-12-14

保存为pcm，提交到百度也是同样的错误，我想问下pcm到底需要什么格式呢，我们是直接读取声卡的数据按小端序保存到文件中的，后缀名为pcm...

有没有懂的批量将wav文件转成文本有偿

/forum/topic/show/972680 2020-11-27

有没有懂的批量将wav文件转成文本，并且将转出来的文本查找些关键字进行分类，如果有人会的可以联系我270223018，有偿的。...

语音合成返回空对象，如何得到mp3文件？

/forum/topic/show/497569 2018-01-17

如图，返回的header和body分别如下：请问，为什么body返回了空的object，我该如何拿到mp3文件，或者是语音？...

百度机器阅读理解技术再获突破，MS MARCO

/forum/topic/show/890024 2018-09-18

（ensemble）结果。此前，在机器阅读理解领域，研究者多参与由斯坦福大学发起的 SQuAD 挑战赛。但相比 SQuAD，MARCO 的挑战难度更大...

语音识别词库文件上传没有效果

/forum/topic/show/493837 2016-03-14

我已经上传了语音识别词库文件，上传了之后也还是没有效果。如上传了摆渡，当我读这两个字的时候还会出百度，我都上传了一周了，不要问我是不是已经生效了，都已经生效很久了。...

长语音识别对语音文件如格式、采样率、编码的要求

/forum/topic/show/497381 2018-01-05

长语音识别是只支持在线识别模式吗，对语音文件如格式、采样率、编码的支持是怎样的？技术文档中只看到REST-API对语音格式的支持...

PaddleOCR的字典文件一改，再训练acc就一直是0

/paddle/forum/topic/show/992875 2021-12-17

。然后把字典文件改成自己的，其实就是0到9一共10个数字，其他啥都不改，再训练，训练了好久好久，acc都一直是0，这是怎么回事啊？ ...

创投领域:专家计划软件免费版-案例分享

/paddle/forum/topic/show/4145332 2023-10-26

专家计划软件免费版【✅林焕东先生óó：6594756】✅網：FCW28.vip✅携手富彩✅共创辉煌✅购彩首选✅行业第一✅誉响彩界✅问鼎巅峰...

词法分析中loc_details返回的条件是什么

/forum/topic/show/497604 2018-01-19

的时候loc_details的返回仍然是空，请问一下loc_details的返回条件是什么？...

工控机上软件怎么把图像数据送给EasyBoard

/forum/topic/show/961587 2020-07-12

上位机操作系统Ubuntu16.04, 运行着一套实时成像和处理软件，希望将处理后的一些图像送给EasyBoard去进一步识别，因为上位机...

深度学习框架的五大核心组件

/forum/topic/show/498029 2018-02-22

Krishnan Santhanam在博客上撰文，概括了大部分深度学习框架都会包含的五大核心组件，为我们详细剖析了深度学习框架一般性的内部组织结构...

Dictate Sub功能——字幕软件革新的关键

/forum/topic/show/966693 2020-09-18

有口音或者吐字不清；②录音设备缺陷；③说话者所讲的语言是现有的软件不能识别的；④在汉语、日语、朝鲜语中大量存在的同音字现象，造成识别的混乱...

ios 证件识别界面能自定义吗

/forum/topic/show/943344 2019-04-25

，怎么避免这个事呢，那个勾勾和叉叉的点击事件有什么地方可以控制吗，或者说那个界面能自定义吗...