
## 1. 模型效果XGBoost是一种传统的机器学习方法,能够用于时序预测任务。在Electricity数据集上,预测长度为336时,预测目标是单元MT_320维度,我们实现了0.401的MSE和0.456的MAE性能指标。更多关于PaddleTS的内容,可以点击 [PaddleTS 仓库](https://github.com/PaddlePaddle/PaddleTS) 进行了解。## 2.技术方案XGBoost是一种经典的机器学习模型,作为一种前向加法模型,其采用Boosting思想,将多个弱学习器通过一定的方法整合为一个强学习器,用多棵树共同决策。用每棵树的结果都是目标值与之前所有树的预测结果之差,所有结果累加后得到最终的结果,从而模型效果得到提升。XGBoost是由多棵CART(分类回归树)组成,可以处理分类回归等问题。### 相关论文以及引用信息```@inproceedings{chen2016xgboost, title={Xgboost: A scalable tree boosting system}, author={Chen, Tianqi and Guestrin, Carlos}, booktitle={Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining}, pages={785--794}, year={2016}}```## 3. 如何使用### 3.1 数据准备数据准备说明参考:[长时序预测](https://ai.baidu.com/ai-doc/AISTUDIO/Clkg7m4y9#%E9%95%BF%E6%97%B6%E5%BA%8F%E9%A2%84%E6%B5%8B%E4%BB%BB%E5%8A%A1)。检查数据组织格式是否满足要求,如果不满足请按照规范说明进行调整,否则将导致数据校验环节无法通过。完成数据准备后,点击右上角 `创建模型产线` 。在 AI Studio 云端,可以通过挂载数据集的方式来使用自己的数据。模型产线创建和修改窗口可以挂载和管理数据集,如下图所示。数据集挂载成功后,需在开发者模式中查看并解压挂载的数据集,数据集路径查看方式为【开发者模式】-左侧【资源管理器】,在目录 `AISTUDIO/data` 下,数据集解压方式为【开发者模式】-左侧【菜单】-【终端】-【新建终端】,在【终端】中通过命令行方式解压,并将解压后的数据集路径拷贝到【工具箱模式】-【数据校验】-【数据集路径】。**注意:在AI Studio云端,`data`目录不持久化存储,如需持久化存储,需要将数据解压到其它目录。**在本地端-工具箱模式中,您可以直接在【工具箱模式】-【数据校验】-【数据集路径】中填写本地数据路径来使用自己的数据集。在配置完成【数据集路径】后,即可点击【开始校验】按钮进行数据集校验更多详细说明,请参[考在线文档](https://ai.baidu.com/ai-doc/AISTUDIO/Zlist35hy#%E6%95%B0%E6%8D%AE%E6%A0%A1%E9%AA%8C)。### 3.2 模型训练PaddleX提供`工具箱模式`和`开发者模式`两种开发模式:- `工具箱模式` 推荐 AI 开发经验较少的开发者使用,高阶开发者也可以使用这个模式来提高开发效率。工具箱模式利用 gradio 搭建 webui 工具链,可以实现无代码 AI 模型开发。主要包含数据校验、模型训练、评估测试和模型部署四个环节。可以根据实际需求选择模型结构、骨干网络及对应的训练参数、优化策略,使得任务效果最佳。关于工具箱模式的完整使用请参考[在线文档](https://ai.baidu.com/ai-doc/AISTUDIO/Zlist35hy)。**注意:工具箱模式中的训练轮次、批大小、学习率等参数的默认值仅适用于官方提供的示例数据集,对于自己的数据集,需要进行针对性的调整。** 可以参考参数设置经验:学习率对XGBoost训练效果影响较大,建议放缩进行多次尝试。<img src="https://user-images.githubusercontent.com/18344247/258573405-fcdb1cd9-eed6-4669-a295-57e0e94463b2.png" style="height: 300px">- `开发者模式` 推荐 AI 开发经验较丰富度的开发者使用,集成了 VSCode IDE 环境,并内置飞桨统一模型开发 API——UAPI,可以使用统一的 API 接口进行开发,仅需 5 行命令即可完成基础模型训练、推理、评估导出以及多模型组合预测。同时,在开发者模式中可以编辑工具箱模式的源码,以实现工具箱模式 DIY。关于开发者模式的完整使用请参考[在线文档](https://ai.baidu.com/ai-doc/AISTUDIO/Mlist5jov)。<img src="https://user-images.githubusercontent.com/18344247/258573175-e11e0afd-7f10-4b36-a632-029e74145a52.jpeg" style="height: 300px">### 3.3 模型部署- 部署支持情况: 目前不支持部署