【关于飞桨和EasyDL的关系】
EasyDL是基于飞桨PaddlePaddle框架的一站式AI开发平台,集成了云端算力和开发环境,提供定制化AI模型训练及服务部署功能支持。EasyDL平台支持从数据管理与数据标注、模型训练、模型部署的一站式AI开发流程,通过原始图片、文本、音频、视频类数据经过EasyDL加工、学习、部署可发布为公有云API、设备端SDK、本地化部署及软硬一体产品。
两者在使用上的区别:
– 飞桨的使用方法通常是下载安装包后,配置本地环境,通过使用飞桨的工具集和API在本地算力环境上完成模型开发;
– EasyDL则是一个云端平台,已经集成好了飞桨框架,并预置了完善的开发环境、模型训练集群及任务调度机制,同时也支持数据的在线标注以及模型训练完成后的服务部署,开发者上手即用,只需关注模型开发本身。
Q:Easydl专业版是不是就像ai studio了
A:AI Studio用于学习实践,EasyDL用于企业应用。AI Studio是完全让大家自由发挥,EasyDL专业版首先是内置了丰富了预训练模型,开放的脚本调参是限于某些超参和部分网络结构,这样可以保证模型的基本效果,同时还有一些自动化调优的机制,帮助提升模型效果。
【关于端侧/边缘侧模型开发与部署】
1) 想开发安卓的图像识别应用,平台是否支持
2) 怎么部署线下硬件呢
3) 离线SDK下载到windows.系统下,如何调用
4) 边缘侧的部署方案是基于云的还是离线预先训练好的呢?
5) 比如我有个英伟达的开发板,怎么用?我想部署在英伟达tx1 GPU上
6) 怎么离线部署,转移到自己的应用场景
7) 硬件的话用什么网络传输?4G卡?
8) EasyDL对硬件要求高吗
统一回答:
在EasyDL云端平台上训练好的模型,在发布模型阶段,可以选择发布为“设备端SDK”,可将模型打包成适配智能硬件的SDK,集成到设备端实现离线计算。满足推理阶段数据敏感性要求、更快的响应速度要求。支持iOS、Android、Linux、Windows四种操作系统,并对多种芯片加速,基础接口封装完善,满足灵活的应用侧二次开发。
EasyDL的模型目前已广泛适配了主流的硬件:
ü 经典版:训练模型前,请先参考文档:https://ai.baidu.com/ai-doc/EASYDL/ok38n2w9h#%E4%B8%B0%E5%AF%8C%E7%9A%84%E9%83%A8%E7%BD%B2%E6%96%B9%E6%A1%88
丰富的部署方案,查看线下硬件对应的部署方式。在该部署方式下训练完成后,只需要随着平台指引下载对应的安装包,并根据我们提供的开发文档将安装包集成到线下硬件即可。
ü 专业版:模型训练完成后,您可以在部署模型页面选择模型和部署方式。页面上会针对您训练好的模型,列出支持部署的硬件范围。在部署页面选择硬件并提交后,您只需随着平台指引下载对应的安装包,并根据我们提供的开发文档将安装包集成到线下硬件即可。由于专业版的模型支持开发者自定义,我们不能确保您训练出的模型一定能部署在某种硬件上。如果您在部署页面没找到您的硬件,或者在集成安装包的过程中遇到问题,您可以通过页面指引提交工单把问题反馈给我们。我们会根据您的业务需求和技术可行性综合判断后,给您提供支持。
提问中提到的英伟达TX1的开发版、Windows环境的嵌入式开发,都是支持的。关于上述开发者提到的网络传输,如果是在设备端硬件上离线部署SDK的话,在使用过程中是不需要联网的,也就是纯离线计算。
离线SDK具体操作方法请参考如下说明文档链接(以经典版图像分类为例):
1、 图像分类模型发布为离线SDK:https://ai.baidu.com/ai-doc/EASYDL/6k38n39wz
2、 图像分类AndroidSDK集成文档:https://ai.baidu.com/ai-doc/EASYDL/Vk38n3att
3、 图像分类WindowsSDK集成文档:https://ai.baidu.com/ai-doc/EASYDL/vk38n3a57
4、 图像分类LinuxSDK集成文档-CPP:https://ai.baidu.com/ai-doc/EASYDL/1k38n3ade
5、 图像分类LinuxSDK集成文档-Python:https://ai.baidu.com/ai-doc/EASYDL/Ak38n3b2d
6、 图像分类iosSDK集成文档:https://ai.baidu.com/ai-doc/EASYDL/vk38n3alk
同时EasyDL也提供软硬一体方案,直接打包获取“边缘计算盒/开发板+镜头模组”+ “模型SDK“。具体参考:https://ai.baidu.com/ai-doc/EASYDL/Dk38n38jg
【关于数据处理、标注和数据安全】
1) 数据标注是一个什么流程,还是有人来完成么
2) 为什么文本分类里没有多标签分类?(此功能正在开发中,上线后会发布公告)
3) 样本标注在线做么?
4) 数据标签只支持 1000个吗?
5) 在服务器端会完成图片的旋转、灰度调整、局部裁剪等操作来辅助提高精确度吗?还是需要本地先处理好之后再上传
6) 刚刚训练的数据集很小,如果用专业版的话可以训练很大的数据集吗?比如imagenet那么大的?训练速度如何?
7) 数据怎么管理,上传很大呢
8) 从视频流到切割图片,这个哪里有资料?
9) 数据安全问题
统一回答:
在EasyDL平台上,可以上传数据、在线标注,并可以通过智能标注功能,自动进行数据标注。同时在模型训练环节提供自动化的数据增强功能。(以经典版物体检测为例,数据标注相关更详细内容参考文档:https://ai.baidu.com/ai-doc/EASYDL/Mk38n31zl)
– 数据上传:小数据集可以在页面上点击文件上传,大数据集可以通过数据管理API上传;
– 数据标注:在线标注支持图像分类、物体检测、图像分割、文本分类等,在线标注需要人工完成,支持多人协同;
– 智能标注:物体检测、图像分割数据标注支持智能标注,开启智能标注后,系统会从数据集所有图片中筛选出最关键的图片并提示需要优先标注。通常情况下,只需标注数据集30%左右的数据即可训练模型。与标注所有数据后训练相比,模型效果几乎等同;
– 数据增强:EasyDL专业版中支持多种自动数据增强策略,具体参考文档《专业版训练任务高级配置》:https://ai.baidu.com/ai-doc/EASYDL/Lk5gel1di
– 数据安全:EasyDL平台遵循百度智能云数据安全规范,所有开发者上传的数据都遵循严格的保密协议,同时存储系统也通过国家安全标准,具备高可用和强安全保障的特性。开发者可以放心使用。
关于上述问题中的“从视频中截取图片”的问题,百度提供视频抽帧工具,如有需要可联系工作人员。
Q:基础版的数据和专业版的数据,共享吗?
A:在2019年10月之前在基础版的数据,平台已自动帮大家导入到专业版了,在此之后在基础版新增的数据不再同步。如果有数据集迁移到专业版的需求,可以给平台发工单。不过基础版和专业版的数据集的修改不会同步,是各自独立的。
Q:数据增强后的效果会不会下降?
A:的确是有可能的,增强有可能会引入不合适的特征,导致下降。这也是我之前强调说的,数据增强时需要大家对自己的数据集和应用场景有一定的了解。同时推荐使用自动增强,理论上讲会导致模型效果下降的增强操作它的权重搜索出来会很低
Q:单图单标签也是需要json文件吗?json文件就是标注的信息吧?
A:在上传已标注的数据集的时候,是需要大家提供与图片名同名的json文件的,json文件是对图片标注信息的描述,具体分类以及检测下json文件的内容格式,可以查看:https://ai.baidu.com/ai-doc/EASYDL/ak38n3rhe ,(分类) 、https://ai.baidu.com/ai-doc/EASYDL/Hk38n3r13 ,(检测)文档链接进行详细了解。
Q: 有没有实时数据的曲线图示
A:暂时还没有,未来可能会考虑用户的需求,新增该功能。
Q: 我的怎么没有数据增强,是只有商品识别那个
A: 数据增强是专业版独有功能,当你在专业版创建物体检测或图像分类单标签任务即可看见数据增强的选项。 图像分类多标签的数据增强能力近期也会开放。
Q: 各种数据增强的代码可以看到吗
A: 目前平台不支持查看数据增强代码,有能力的同学可以去github上搜索数据增强相关的项目。
Q: 数据增强有加噪声这项吗
A: 所有数据增强策略都会或多或少增加不同的噪声,来提升模型的泛化性。
Q: 能演示一下如何 手动标注货架坐标和标签吗
A: 这个咱们前几期视频中有物体检测任务的标注流程,不熟悉的观众可以前去观看前几期的视频来进行学习。另外在easydl平台进行数据标注是一件非常轻松的事情,用户可以去平台上体验下。
Q : 是mixup数据增强吗
A:mixup是一种数据增强,这种类型能增强模型效果的增强技术我们后续会以可选组件的形式开放在模板代码中。
Q: 可以单纯只对数据进行增强,下载到本地吗
这个平台目前不支持这个功能,所有的数据增强是在平台内部进行的。
Q: 能否下载数据集自动标注后的JSON文件?
目前平台不支持这个功能,相关需求我们内部会进行评估。。
【关于SDK部署服务】
Q:是否支持私有化,私有化部署怎么收费?私有化部署需要什么样的硬件环境?
A:EasyDL支持将训练好的模型部署到私有服务器中,实现本地化推理预测服务,目前支持x86-64 CPU、Nvidia-GPU硬件,即将支持华为Atlas300,提供本地API和服务器端SDK两种服务部署方案。只需在发布模型时提交私有服务器部署申请,通过审核后即可获得一个月免费试用。正式购买时,支持线下按设备购买单个模型的永久使用授权,单个CPU机器或GPU卡,私有部署的价格为3万/模型。如图像分类私有化部署包获取,可参考文档:https://ai.baidu.com/ai-doc/EASYDL/Zk38n39gg
Q:部署License的作用是什么?
A: License完成对sdk的激活。
Q:请问部署到设备上,有相应端口吗?
A: 我们理解这个问题是想问是否支持将部署到设备端上?支持的。目前EasyDL提供多种部署方式入口,包括云端、本地、设备端、软硬一体等。如何部署模型我们在EasyDL实战营的第4课展开了详细的介绍,可参考课程回放进行学习:https://www.bilibili.com/video/av92314982
Q: 能生成带API文档的本地SDK?
A: 本地SDK里有readme, 里面有文档的链接。
【关于模型训练、效果和模型调优】
1) 长沙地铁 工器具识别训练的情况如何? 一个工具大概要多少训练图片,识别成功率为多少呢? "
2) 训练的模型不满意,怎么调优?
3) 能解释一下F1-score,精确率,召回率吗?
4) 机器检测的数据怎么加入数据集优化
5) 精度不满意的话 怎么调整
6) 请问可以用Python调用吗,Python上传数据集返回模型?
统一回答:
EasyDL模型效果:EasyDL平台因其内置的优质的飞桨预训练模型、AutoDL、Transfer Learning等技术,可实现基于小数据集的优秀的模型效果,目前物体检测模型线上平均准确率达到93%。课程中提到的长沙地铁的项目,大约用了几百张图片样本,达到了超过90%的模型效果。
模型效果评估:在EasyDL平台上完成模型训练后,可在线查看模型评估效果,通常用以下几个指标评估模型效果,包括:
– F1-score:对某类别而言为精确率和召回率的调和平均数,对图像分类/文本分类/声音分类等分类模型来说,该指标越高效果越好
– 精确率:图像分类/文本分类/声音分类等分类模型的衡量指标,正确分类的样本数与总样本数之比,越接近1模型效果越好
– 召回率:对某类别而言为正确预测为该类别的样本数与该类别的总样本数之比
EasyDL提供了详细的模型评估报告,以及在线可视化上传数据测试模型效果的功能,如经典版图像分类模型评估功能说明参考文档:https://ai.baidu.com/ai-doc/EASYDL/Ak38n30uk
模型效果调优:EasyDL平台提供了多版本管理、模型效果评估及错误示例、云服务数据闭环管理等多种功能,帮助开发者完成模型迭代,提升模型效果。上述问题中提到的“机器检测的数据如何加入数据集优化模型”,可以使用EasyDL的“云服务调用数据管理”功能,将机器检测过程中模型识别置信度不高的数据自动导入数据集,帮助模型迭代。在文档中有详细说明,如经典版图像分类模型调优指导,可参考文档《如何提升效果》:https://ai.baidu.com/ai-doc/EASYDL/ak38n30mi
模型调用:模型训练完成后,可以发布为云服务API、设备端离线SDK、私有化部署等多种服务形式。上述开发者提到的关于Python调用的问题,EasyDL可以支持,具体请参考文档中的示例代码:https://ai.baidu.com/ai-doc/EASYDL/Sk38n3baq
更多相关概念资料,请查看:https://ai.baidu.com/ai-doc/EASYDL/vk38n3njj
Q:图像分类的 单图多标签 和 物体检测,有什么区别
A: 单图多标签应用于某张图的主体有多个属性(属于多个类别),比如女生/戴眼镜/青年人;而检测是检测出物体的位置,并归为某类。主要根本区别还是在于是否需要定位物体
Q: 如何通过日志 绘制 acc loss曲线,有没有类似Tensorboard的显示
A:目前需要大家自行复制日志出来,解析格式日志来绘制。我们也会与PM反馈增强训练过程中相关图表的展示
Q:模型可以以文件形式保存吗?
A:平台训练产出的模型是以文件的形式进行保存,大家可以采用公有云、私有化、设备端SDK、软硬一体的方式实现模型的部署。
Q:知识图谱有吗?
A:EasyDL专业版目前支持视觉和文本两大方向,暂时不支持知识图谱。如果有相关需求,可以到ai.baidu.com开放能力知识图谱方向进行了解。
Q:专业版视觉模型有没有 anchor free?
A:专业版目前还没有,未来可能会考虑支持。目前基于anchor的检测模型在生产实践应用比较成熟,性能也比较好。而且目前检测领域最佳精度的模型还是基于anchor来构造的。所以从生产效果及稳定性角度出发,我们还是以提供基于anchor的模型。当然我们也会同步跟进业界的最新研究成果,未来会考虑推出anchor free系列的模型。
Q:专业版视觉模型有没有image caption 的模型?
A:image caption任务是根据图片来自动生成一段描述性文字。 相关能力在百度内部是有做前沿研究。但这个任务上的模型效果是否足以满足生产需求?相关应用场景是否已经明确?这些问题都还需要进一步评估。后续如果时机成熟,我们内部也会跟进评估相应的需求。
Q: 能对视频进行扫描分类吗?
A: easydl经典版支持视频分类,用户可以尝试下是否能满足需求。
Q:有yolov3吗?
A:有yolov3,预计后续还会上线更多通过百度技术强化后的yolov3变种模型。
Q : 可以做分割任务吗
A:目前图像分割在EasyDL经典版上支持,未来会在专业版上引入图像分割等其他能力。
Q:模型结构可以修改吗?
A: 专业版目前支持模型结构的部分修改,未来也会持续更新模型修改体验。
Q: 可以自己写模型嘛?类似colab??
A:easydl专业版暂不支持用户自定义模型,但相关能力已经在开发中,预计近期就会开发。
用户可以先试用ai studio, aisudo支持用户写模型,主要用于学习实践机器学习能力。
Q: resnet一边是2个卷积,只1个可以吗?
A: 模型结构的修改是一件需要尝试的过程。只要输入输出的关系不变,当然可以无缝对resnet模块进行改造。但改造之前最好先理解设计者的设计思路,两个卷积是起了bottleneck的作用,减少了很多的计算量,如果只用1个卷积当然也可以,但设计上要注意整体计算量是否会过高。
Q:目前多分类任务最大量级是多少呢?
A:多分类任务训练时无标签个数据的限制。但单个数据集会限制1000个标签。
Q:少量数据集真的可以做到那么高准确率吗? 如果用了easydl,效果上不去怎么办?
A: 问题中“少量”的定义不明确。我们建议用户每类至少大于50张图片,低于这个数量是我们认为的少量。一方面,用这个“少量”数据去训练模型,模型学习的有效特征较少,效果会不太理想;但另一方面,我们的模型均在超大规模的数据集上预训练过,用户在这个基础上对自有数据进行finetune,一般情况下,正常的数据集都可以训练到较高的准确率。
用了easydl, 效果如果上不去,建议优先查看数据集,看是否数据本身有问题。其次可以考虑采用平台的系列效果优化机制优化模型,如果效果依然不理想,可以通过工单、QQ、微信群反馈问题,我们们会有专门的工程师跟进问题。
Q: 自动数据增强是不是自监督学习方法?自动数据增强的策略是什么?
A: 用户如果想了解自动数据增强的策略,我们推荐一篇经典论文,《AutoAugment: Learning Augmentation Strategies from Data》, 其中的建模思想在后续的其他自动数据增强方法中也是得到了沿用的。
Q:需要显卡吗?最大算力有多大?
A:目前EasyDL提供免费的算力支持。GPU型号: V100 16GB VMem, CPU型号: 12 Cores 56GB Memory。目前Tesla V100单精度(FP32)计算性能是 14 TFLOPS
Q:这是自动分配的显卡?
A: 是的。整个训练通过我们的调度系统自动分配显卡,用户不需要关心显卡分配的细节。
Q:请问可以支持分布式吗?
A:EasyDL经典版本身是支持分布式训练。EasyDL专业版近期也会上线分布式训练,提供给用户更快速的训练能力。
Q: yolov3的epoch怎么设置?
A: epoch的设置依赖用户的数据量,对于检测模型,可以简单的用公式计算,epoch=20000/数据总量。具体地,数据量小于100张,建议epochs设为200以上;数据量在100-500,epochs设为100;数据量在500-1000,设为50;数据量大于1000,建议设置20。大于10000:epochs设为10。
Q:yolov3的max_batches怎么计算?
A:max_batches=max_iters=最大迭代次数=(样本总量/batch_size/GPU数量)*epoch
EasyDL专业版的模板为单机单卡的配置,后台会根据实际训练的GPU数量,进行弹性调整。
Q:专业版cv视觉课演示的超市产品的识别技术成熟了吗?
A:目前EasyDL有专门的零售版,集成了很多功能, 包括支持商品检测、场景检测、货架拼接、货架合规性检测等功能,下个月还会上线货架检测、层数识别等功能。详情可见官方:https://ai.baidu.com/easydl/retail
Q:单图多标签数据自动打标签技术成熟么?
A: 我们的智能标注能可以认为是一种自动打标签的技术,相关技术可以应用于单图多标签数据的标注,后续我们会开放相应功能。
Q:自己的数据别人能看到吗?可以设置priv?
A: 用户的数据集仅属于用户,是私密的,其他人看不到。不过经典版目前支持数据集共享,用户可以将自有数据集共享给指定用户,并进行多人标注。
Q: 老师,可以查看模型网络结构吗
A: 如果你是在我们平台进行训练,采用离线部署方式,是可以通过easyedge来察看模型网络结色,可以参考https://ai.baidu.com/easyedge/app/models/new
此外可以去模板里推荐的链接是 paddle的github库中去下载预训练模型,简单转换成inferecnce model,就可以使用netron软件对网络结构进行查看。
可以参考https://blog.csdn.net/yzl819819/article/details/104743106/
Q: 平台会显示模型的检测速度么?
A: 平台上目前没有检测速度显示。检测速度和用户的的调用方式,部署方式相关,不同硬件的检测速度不太相同。如果是端设备部署,可以去https://ai.baidu.com/ai-doc/EASYDL/Zk38n3wik 查看不同端设备上的速度。
Q : 已发布的模型可以删除吗
A: 可以删除的
【关于收费】
Q: 平台是否收费?模型部署是收费的么?百度算力如何收费?接口还在测试时候就需要收费了吗?
A:EasyDL面向不同人群属性推出了经典版、专业版、零售版。不同子产品价格及计费方式略有不同。
– 目前经典版数据标注及模型训练阶段免费,模型训练完成发布为在线服务、离线sdk时,将收取接口调用费用和sdk授权费,同时平台也会提供一定量的免费调用资源和测试授权供测试阶段使用。
– 目前专业版全线功能在公测阶段均可免费使用。
– 零售版数据标注和训练阶段免费,训练完成的模型发布为API服务后收取接口调用费用,同时也提供一定量的免费测试额度。
更多详情,参考文档《EasyDL价格说明》:https://ai.baidu.com/ai-doc/EASYDL/8k4w58167
【智能标注】
Q 标注时候,框重合影响不大吧
A 框保证是框住目标物体的最小矩形框,当物体间有遮挡时难免有重合,没有关系
Q 怎么确定智能标注的准确性
A 抽查模型预测框,看准确率是否达到要求,比如90%以上,具体值以您实际测试结果和业务标准为主
Q 智能标注貌似已经是在做预测了?
A 是的,智能标注就是通过模型来帮助大家降低标注成本
Q 可以先数据共享,再智能标注吗,这样更快
A 建议的方式是先把数据分片,各自智能标注,然后再共享数据集
Q 智能标注是否只适用与图片?
A 智能标注的能力对文本、声音、视频分类等场景同样适用,我们会逐步开放。
【声音分类】
Q 声音分类有哪些应用场景?
A 安防领域:安全声纹识别、异常声音识别及预警;医疗诊断:心率异常识别;机器人:声音指令识别;互联网直播平台:涉黄直播检测
Q 有办法抽取乐曲中的某个乐器的声音么?
A 目前声音分类的能力可以把一段音频标注上对应乐器的类别,做到一小段音频预测哪种乐器。
【NLP自然语言处理相关】
Q 文本分类要用word embedding吧?
A 文本分类使用word embedding技术是常用的技术,该技术起源于2003年Bengio的论文 Neural Probabilistic Language Model,在2013年Google的word2vec把它发扬光大。但是自2018年起,NLP领域兴起预训练风潮,这一方面需要海量数据,另一方面需要更深的网络,百度自研的ERNIE是该方向的佼佼者。使用ERNIE的预训练模型可以使得性能比传统的word embedding技术更好。
Q:文本支持哪些格式?
A:目前在专业版上文本方向开放了文本分类、文本匹配以及序列标注的模型训练,文本分类的数据集目前支持的是单文本单标签的形式。支持单文件、压缩包以及API接口调用的方式上传数据集,文本的文件类型为txt,编码仅支持UTF-8。采用压缩包上传的方式需要在压缩包内放有与文本文件同名的josn格式标注文件,可以查看https://ai.baidu.com/ai-doc/EASYDL/qk38n3pok 数据集文档了解具体的细节内容。
Q:无法进行单文本多标签吗?
A: 文本分类方向暂时只支持单文本单标签,后续平台也会逐渐完善对单文本多标签数据集的支持。
Q:支持TensorFlow和Pytorch吗?
A:只支持飞桨PaddlePaddle
Q: EasyDL的线上标注工具是免费的吗?
A:目前平台处于公测免费阶段。后续平台的计费项目主要以算力和模型为主。
Q:为什么还要定90天有效期呢(key)?
A:目前属于公测免费阶段,无法提供终身免费的key。您可联系工作人员,描述业务需求,我们会视情况为您延长有效期。
Q:ERNIE 2.0 的 machine reading comprehension 也可以在 EasyDL 上训练吗?
A:目前平台只有分类、匹配、序列标注三类,机器阅读理解任务暂不支持在平台上训练~后续会考虑进行支持
Q:平时训练要自己改参数?还是默认?
A:系统提供了默认的参数,您可根据自己的业务情况,将对应的参数做修改,也可使用默认参数。
Q:怎么标注文本?
A:可以在平台上,定义标签,对样本逐一选择。详情可参考平台文档:https://ai.baidu.com/ai-doc/EASYDL/Wk38n3qkd
Q:如果是自己标注,每一类标签至少多少数据量
A:数据量需要根据自己的业务需求,也需要考虑线上业务的数据分布情况考虑比例问题
Q:什么技术可以用来标注样本?
A:平台已规划「文本智能标注」的产品功能。敬请期待
Q:日志里显示准备训练环境很久是在下载框架吗?
A:不一定,可能在排队等机器
Q:智能标注背后用到的算法、模型是什么?
A:使用ERNIE模型。
Q:模型训练里的“短文本匹配”是干什么的,文本长度超过模型输入长度怎么处理?
A:短文本匹配可以判断文本的相似度,目前超长文本会做截断处理,【文本匹配】也会在后续课程中讲解。
Q:标注工作量大的情况下,有没有好的标注的方法,智能标注也总有不准确的吧?
A:智能标注支持手工校正。
Q: 除了情感分析,还可以做其他的二元分类吗,比如书面语与口语识别?
A:平台提供的任务粒度的模型训练,属于通用的二分类模型,您可根据场景需求,整理数据集提供训练即可
Q:除了中文外,可以处理其他语言吗?支持英文么?
A: 如果您有英文模型训练的需求,建议仅使用预置网络,不选择预训练模型
Q:如何进行微调?如果没选验证集是从上传的随机抽取一部分吗?
A:如果您在模型配置时,选择评测集,系统不会产出评测报告。为了验证效果,建议上传评测集
Q:luid.layers能单独看到吗?
A:可前往PaddlePaddle官网查看
Q:可以用在电商评论正负评论分析里吗?
A:平台提供的任务粒度的模型训练,属于通用的二分类模型,您可根据场景需求,整理数据集提供训练即可。
Q:文本长度超过模型输入长度怎么处理?分词工具是你们自带的吗?效果怎样?
A:平台提供数据样本的自动分词能力。分词工具时基于百度NLP的算法设计,相关信息可前往百度分词LAC开源工具
Q:做分类时,如果样本数据不均衡,怎样提高?
A:建议针对数据集进行修正,提升的效果比调整模型更有效
Q: multi-label的任务后期会上线吗?另外multi-label比较常用的模型是什么?我看到多数是转化成二分类问题
A:多标签的需求我们正在规划,感谢反馈
【其它问题】
Q:训练之后模型可以下载吗?
A:EasyDL目前不支持直接下载训练好的模型文件。但我们支持您通过以下三种方式离线运行模型:一、如果希望将模型集成在前端智能设备中,可以下载包含了模型文件的设备端SDK;二、如果希望将模型集成在服务器中,可以下载包含了模型文件的私有部署包,支持私有API和服务器端SDK两种集成方式;三、如果您还没有采购硬件或正在评测多种硬件方案,可以了解我们提供的软硬一体方案,购买后可以同时获得硬件和深度适配硬件的专用SDK。
Q 分类名称可以是中文不?
A 目前只支持英文名称
Q 实现盘点钢管或者盘点木材么
A 可以。在钢管或者木材的横断面拍照,然后在物体检测任务里进行标注,训练,就可以得到一个检测模型,然后利用这个检测模型的结果做统计就可以计数了。
Q easydl适合不懂算法,但是懂业务的人用吗?
A EasyDL平台经典版就是要让零算法基础的人也能轻松应用AI的能力,让那些各行各业懂业务的人员能够在EasyDL平台一站式地体验模型训练、服务的整套流程,从而发掘AI在行业落地的可能性,让AI赋能各行业的发展。有算法基础的用户,可以尝试专业版使用。
Q : 能不能导入requests
A:这个问题比较模糊,我们对这个问题有两方面的解读。
1.阈值模板里是否支持import requests等第三方包? 目前我们的模板均可以导入系统预安装的包,包括requests,但我们会对模版做安全性检查,符合安全标准的调用才能进入让模版进行正式训练阶段。
2.是否支持API方式的调用模型,
目前我们支持多种方式部署、调用模型,包括API模型调用。具体使用方式参见我们的技术文档https://ai.baidu.com/ai-doc/EASYDL/pk38n3odv
Q: 货架挡板这个case 是基于什么样的场景
A: 货架挡板一般基于商品检测,在零售领域,需要对货架的陈列进行审核。还有一种情况是需要对货架层数进行计数。近期EasyDL零售版也会开放相关的货架层数识别能力。
欢迎加入直播QQ交流群:1042470058(经典版)、868826008(专业版)
《大圣陪你学AI:人工智能从入门到实验》哪里有卖
问题:easydl我8月份之前所有功能都跑了一遍,确实很强大,很好用,特别是《大圣陪你学AI:人工智能从入门到实验》,这本书,看了小朋友也会使用easydl来解决各种机器学习任务。
1.easydl中的easydata最大的亮点就是数据的管理,作为机器学习,这个非常重要,功能性能非常漂亮,这个单卖不?此外easydl支持导入TF的TFRecord格式数据不?其他模型能否导入?
2.我有一些地理卫星信息图,飞机识别的,一个数据包可能就200G左右,一张图可能有40-200M左右大小,标注信息为GeoJson格式。是不是使用前需要自行切图,听了理论,但是如何切图,以及标注格式转换?easydl能否导入使用?如果不能需要做哪些工作,有哪些注意事项?
持续更新
一直在找这个的问题答复帖子~~~很好,很强大~~
好详细
感觉 集成后 开发倒是省心很多 但总觉得 缺点什么
学习了!
可以实现农业上的谷物破碎率、含杂率识别吗
可以实现农业上的谷物破碎率、含杂率识别吗
为什么我的序列标注文件导不进去?报
序列标注
IOB
导入失败
1、存在标注标签不在label_map.json文件中,请确认后再次上传
附标注文件:
歐 盟 對 土 耳 其 亮 綠 燈 SEG-B SEG-I SEG-B SEG-B SEG-I SEG-I SEG-B SEG-B SEG-I
JSON:
{
"SEG-B": 0,
"SEG-I": 1,
"O": 2
}
优秀
详细! Up!
总结的非常好,顶
已收获
总结得好!!
顶起来