OCR 字符识别
你好,在字符识别的OCR 中,传入到API的是base64编码的字节流,我用二进制方式打开图像,转换后可以。但是对于numpy.array...
语音正在播放时,怎样快速切换到下一句话呢
this._ttsUtils.stop();this._ttsUtils.speak("见到您真是太开心了,我这一天都会是好心情");
不知道这样写是不是不对呀...
3300和3301的兄弟看看
折腾了一晚上,终于把DEMO程序跑起来了。有几个地方要足关注一下,可能在开始的时候会出现3300和3301的问题,请检查你的json数据...
还在寻找AR交互光学动捕相机厂商么!
GM系列千兆网接口动作捕捉相机主要应用于三维空间定位和动作捕捉,特别是大空间的高精度空间定位。通过SDK开发包可以实时获取标志点的空间三维...
关于label的一些问题
label图片打开发现有两种
一种是不同类别用不同的颜色表示,请问这种表示方式有没有颜色(像素值)和类别的对照表,方便one-hot编码...
base64编码转为图片问题
调用人像动漫化接口,返回的base64编码转为图片显示出问题,一开始我还以为是我转图片的代码写错,试一下在线转码发现也是如图显示。
能否...
ERNIE到底是一个什么东西?
这两个事情都能作,似乎效果更好。有点蒙圈了!!!
谁能通俗的给讲一下,ERNIE到底是一个什么东西(不要跟我说是一个语义模型)?能干什么?跟基于Paddle开发的其他模型,是什么关系?...
图像分类数据増广结果对比
1.无数据増广。验证集loss训练开始很快就不再下降。说明过拟合明显。
2.简单数据増广,拉伸,旋转,翻转,明暗,色调,清晰度,高斯噪声...
视频活体检测
H5活体检测,移动端只有IOS苹果系统可用、但在安卓系统就不能用了、官方的示例项目也不能在安卓的浏览器中使用、我这边开发的问题出在安卓...
如何在生成语音时得知各字的时间标签
我希望生成一段任意文字的音频,并得到这段音频内每一个字的开始结束时间。
例如:一[0:00.00-0:00.40]二[0:00.40-0...
如何查看自己的appid号码
经常会被问你的appid是多少?
what?
这是开发者创建应用的时候系统自动生成的一串数字符号,与账户id一起作为确定身份和定位问题...