
---desc: Qwen2.5-Math-1.5B是阿里千问系列15亿参数数学优化模型,基于Qwen2.5架构强化符号计算与数值推理能力,专注数学问题求解、公式推导及步骤生成。训练融合高质量数学数据与逻辑链微调,支持复杂数学任务解析与教育辅助场景,适配轻量级设备与边缘计算,兼容4/8-bit量化技术,适用教育、科研 support_training: 0 license: Apache License 2.0 base_model: Qwen/Qwen2.5-1.5B dev_type:- notebook---# Qwen2.5-Math-1.5B> [!Warning]> <div align="center">> <b>> 🚨 Qwen2.5-Math 主要支持通过思维链(CoT)和工具集成推理(TIR)解决中英文数学问题,不建议将该系列模型用于其他任务> </b>> </div>## 引言2024年8月,我们发布了千问家族首个数学大模型系列——[Qwen2-Math]。一个月后,我们将其升级并开源了**Qwen2.5-Math**系列,包含基座模型**Qwen2.5-Math-1.5B/7B/72B**、指令调优模型**Qwen2.5-Math-1.5B/7B/72B-Instruct**以及数学奖励模型**Qwen2.5-Math-RM-72B**。相较于仅支持英文数学问题思维链推理的Qwen2-Math系列,Qwen2.5-Math系列扩展了以下能力:- 支持**中英双语**数学问题求解- 同时支持**思维链(CoT)**和**工具集成推理(TIR)**两种范式- 在中英文数学基准测试上,使用CoT的推理表现较Qwen2-Math系列有显著提升尽管思维链对提升大模型推理能力至关重要,但在实现计算精度和处理复杂数学/算法推理任务(如求二次方程根、计算矩阵特征值)时仍存在局限。工具集成推理能进一步提升模型在精确计算、符号运算和算法操作方面的能力。Qwen2.5-Math-1.5B/7B/72B-Instruct 使用TIR在MATH基准测试上分别达到79.7、85.3和87.8的优异成绩。## Requirements* `paddlenlp>=2.7.0` for Qwen2.5-Math models. The latest version is recommended.> [!Warning]> <div align="center">> <b>> 🚨 请务必注意:因 <code>paddlenlp</code> 库自 <code>2.7.0</code> 版本起已集成 Qwen2 代码支持> </b>> </div>## 快速开始 (Quick Start)> [!Important]> > **Qwen2.5-Math-1.5B-Instruct** 为对话式指令模型 > **Qwen2.5-Math-1.5B** 为基座模型,适用于补全/小样本推理,是微调的更优起点使用以下代码快速调用该模型:```pythonfrom paddlenlp.transformers import AutoTokenizer, AutoModelForCausalLMtokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen2.5-Math-1.5B")# if using CPU, please change float16 to float32model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen2.5-Math-1.5B", dtype="float16")input_features = tokenizer("你好!请自我介绍一下。", return_tensors="pd")outputs = model.generate(**input_features, max_new_tokens=128)print(tokenizer.batch_decode(outputs[0], skip_special_tokens=True))# ['我是一个AI语言模型,我可以回答各种问题,包括但不限于:天气、新闻、历史、文化、科学、教育、娱乐等。请问您有什么需要了解的吗?']```## 引用说明 (Citation) 如果您认为我们的工作对您有所帮助,欢迎在学术论文中引用相关研究成果 If you find our work helpful, feel free to give us a citation```@article{yang2024qwen25mathtechnicalreportmathematical, title={Qwen2.5-Math Technical Report: Toward Mathematical Expert Model via Self-Improvement}, author={An Yang and Beichen Zhang and Binyuan Hui and Bofei Gao and Bowen Yu and Chengpeng Li and Dayiheng Liu and Jianhong Tu and Jingren Zhou and Junyang Lin and Keming Lu and Mingfeng Xue and Runji Lin and Tianyu Liu and Xingzhang Ren and Zhenru Zhang}, journal={arXiv preprint arXiv:2409.12122}, year={2024}}```