首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
百度大脑-产品/技术/服务覆盖渠道有奖调研
【有奖调研】尊敬的发者,为了将最新产品/技术/服务第一时间同步与您,来促进您的业务更好发展与价值提升,诚邀您参加百度大脑内容覆盖渠道调研...
OCR 字符识别
你好,在字符识别的OCR 中,传入到API的是base64编码的字节流,我用二进制方式打图像,转换后可以。但是对于numpy.array...
语音正在播放时,怎样快速切换到下一句话呢
this._ttsUtils.stop();this._ttsUtils.speak("见到您真是太心了,我这一天都会是好心情"); 不知道这样写是不是不对呀...
3300和3301的兄弟看看
折腾了一晚上,终于把DEMO程序跑起来了。有几个地方要足关注一下,可能在始的时候会出现3300和3301的问题,请检查你的json数据...
REST API并发数量及响应时间相关问题
请问下发大大:并发数越多,响应时间越长是吗?并发数有限制吗?我这边测试并发200多个的时候,请求基本上全部都超时了(超时时间30秒...
ios在线语音合成怎么后台播放?[self.synthesizer setAudioSessionCategory:AVAudioSessionCategoryPlayback];
的 AVAudioSession 类中声明的相关常量,发者可直接查阅AVAudioSession Class Reference。可是我在sdk上...
百度语音合成提示已过期,技术人员请进来看。
添加了应用,也通了语音合成服务,申请了正式授权的;我使用的是2015年的1.0.0的SDK,老版本的还是能使用吧? ...
还在寻找AR交互光学动捕相机厂商么!
GM系列千兆网接口动作捕捉相机主要应用于三维空间定位和动作捕捉,特别是大空间的高精度空间定位。通过SDK发包可以实时获取标志点的空间三维...
关于label的一些问题
label图片打发现有两种 一种是不同类别用不同的颜色表示,请问这种表示方式有没有颜色(像素值)和类别的对照表,方便one-hot编码...
android 人脸识别离线sdk如何前后摄像头
人脸属性检测,场景是打一个界面之后默认显示的是后置摄像头,这个倒没有问题,问题是在后置摄像头这个界面点击按钮切换到前置摄像头检测该怎么...
base64编码转为图片问题
调用人像动漫化接口,返回的base64编码转为图片显示出问题,一始我还以为是我转图片的代码写错,试一下在线转码发现也是如图显示。 能否...
离线sdk支持 M:N的人脸查找模式吗?
单位想做一个人脸的点名系统,大家站一排,然后进行考勤登记。 因为工作性质不能连接外网,只能使用离线SDK进行发. 在网上查找了很多资料...
百度击败微软与Google AI自然语言理解摘冠
最初是为理解中文语言而发,不过百度研究人员很快就发现此模型也能更正确理解英语。...
TensorRT 子图预测是否支持 FP16?
FP16 预测,所以也基本没有应用。然而当前厂内厂外一些新的 GPU 都始支持 FP16,相比于 INT8,FP16 的损失更小、更可...
ERNIE到底是一个什么东西?
这两个事情都能作,似乎效果更好。有点蒙圈了!!! 谁能通俗的给讲一下,ERNIE到底是一个什么东西(不要跟我说是一个语义模型)?能干什么?跟基于Paddle发的其他模型,是什么关系?...
图像分类数据増广结果对比
1.无数据増广。验证集loss训练始很快就不再下降。说明过拟合明显。 2.简单数据増广,拉伸,旋转,翻转,明暗,色调,清晰度,高斯噪声...
视频活体检测
H5活体检测,移动端只有IOS苹果系统可用、但在安卓系统就不能用了、官方的示例项目也不能在安卓的浏览器中使用、我这边发的问题出在安卓...
如何在生成语音时得知各字的时间标签
我希望生成一段任意文字的音频,并得到这段音频内每一个字的始结束时间。 例如:一[0:00.00-0:00.40]二[0:00.40-0...
【AI核心技术】课程二十一:神经图灵机—控制器
其中的具体原理 【视频获取方式】 1.移动端:关注PaddlePaddle微信公众号(扫文末二维码即可),点击“深度学习公课”→“AI技术...
如何查看自己的appid号码
经常会被问你的appid是多少? what? 这是发者创建应用的时候系统自动生成的一串数字符号,与账户id一起作为确定身份和定位问题...
切换版块
智能客服