百度AI2019: 算法突破
相对准确率提升20%。
流式多级的截断注意力模型 SMLTA2. 仅需20句话就可合成专属声音
语音合成方面,针对风格迁移、音色模拟和情感...
人脸识别检测不到人脸
程序在我们的目标设备,使用的摄像头是640*480,却怎么都检测不到人脸,这到底怎么回事呢,是百度人脸识别有最低像素要求吗...
在对话中,如何根据用户的输入,给出不同的答案?
在梳理业务需求的时候发现有个场景是这样的:
用户查询发货价格时,货物重量大于30公斤算物流,小于30公斤算快递,这两种的价格不同,给出的答案不一样,怎么样引导用户得到需要的答案,对话单元该怎么配置呢?...
语音合成
请问退到后台播放时候,锁屏界面控制暂停和播放是怎么做的呢?我使用AVPlayer是可以的,但是切换到百度的语音合成就不展示了呢?现在需求是锁屏界面控制暂停和播放,同时能切换上一章和下一章,请问怎么做呢?...