首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
AudioTrack播放合成语音的问题
   audioPlayer.prepare();    audioPlayer.play();}我用AudioTrack播放合成后pcm数据,但是我觉得声始终...
怎么修改语音源提供给API?
智能硬件上面有多个麦,多个麦收后要进行优化得到单个音频给API,如何修改这部分?主要是对百度API是怎么得到语音的这块不理解...
语音识别与AVPlayer冲突
语音识别后的一个问题是,AVPlayer播放的视频没有声了,但是如果调整一下AVPlayer的播放进度声又回来了。请问大概是哪里冲突了 ...
多音字处理
): 复现步骤、现象及其他描述: TTS之后,‘爪’字的发是zhǎo,请问下如何使发改为zhǔa?...
【案例】度小满支付:卡证识别提升绑卡便捷性
价值成果 度小满支付通过集成百度OCR文字识别-卡片证照识别(银行卡识别)技术,在用户将银行卡添加至度小满金融账户,完成账注册绑定银行卡...
给大家介绍一位非常 开放 的新朋友
开发者大会上,百度副总裁、百度 App & 信息流业务体系总负责博士说,“相信在百度合作伙伴们的共同努力下,我们一定可以重新定义互联...
查询天气,怎么样才能告诉准确的查询结果?
想完成一个简单的查询天气功能,比如问北京天气,回答,今天多云,温度20-30等,但是现实是只能回答“正在查询。。。”  ,怎么解决!...
创建用户后,能查询用户相关的图片吗
是否可以提供接口可以查询指定uid的图片信息,最好是能提供批量导入和批量导出的接口
公测 | 定额发票、VIN码、护照识别抢先使用
,包括国家码、护照、姓名、姓名拼、性别、出生日期、出生地点、签发日期、签发地点、有效期。   应用场景:    ●  财税报销核对:通过...
合成-REST_API 参数lan有其他值吗
lan参数出了zh还能有其他什么值?中英文混合用zh合成的语音英文字母部分有问题,读法不是英文单字母发而且语速特别快,还是说字母只能...
Android 导航 没有语音
key是对的,没声
Error: AudioQueueStart failed (-66681)
我使用的服务是:语音识别 调用的接口是:语音识别接口(无UI的) 参数设置情况:设置开始提示和结束提示 开发平台和机型...
有百度文字识别OCR加持极限词查询更方便快捷智能
来自百度AI开放平台,的文字识别OCR接口),同时加入了宝贝链接查询。在此同时为了拟补极限词更新不及时,我们加入了个词库管理功能,用户可以...
关于Mummy语音识别的疑问
测试接口(英语模式下)的时候,多分别输入mummy语音(包括百度翻译的发),接口始终返回“mami”。 不知为何?  ...
怎样打开
开通服务之后,怎样打开声合成
如何实现对语音的打分?
又分为两种情况: 1、评分完全有AI系统自主判断,没有任何参照。 2、上传对应文本的标准真人发音,以此为参照,AI给出用户发的评分。 请问百度的语音处理服务有没有这样的服务,我翻了一遍没找到,如何实现这样的功能?  ...
语音合成和语音识别同时进行,导致识别不准确
截图能帮助您更快解决问题): 复现步骤、现象及其他描述:     在进行语音合成(例如:读一段文字),这个时候启用语音识别,把合成的声说的声混一起了,这种情况如何处理呢...
Parakeet TTS 旋律问题
话说前面有可以克隆声的模型(个用tacotron2),那我在想,能不能有个在tts更上一层楼的操作,让输出的声有旋律,但是在...
关于返回的脸坐标信息
大佬们好, 关于脸检测中返回信息的对象FaceInfo,其中有centerX, centerY,width 这三个信息,用于接下来...
快,三查询结果
快,三查询结果
切换版块
智能客服