首页 Paddle框架 帖子详情
Paddle支持梯度检查点吗? 已解决
收藏
快速回复
Paddle框架 问答炼丹技巧 1235 5
Paddle支持梯度检查点吗? 已解决
收藏
快速回复
Paddle框架 问答炼丹技巧 1235 5

基本思想是只将一些节点的中间结果保存为CheckPoint,在反向传播过程中对这些节点之间的其他部分重新计算。据发明这个技巧的人说可以10倍大的模型放到GPU上,而计算时间仅仅增加20%

CarryOnGoing
已解决
7# 回复于2022-03
已在官方API下面找到了: https://www.paddlepaddle.org.cn/documentation/docs/zh/api/paddle/distributed/fleet/utils/recompute_cn.html#recompute
展开
0
收藏
回复
全部评论(5)
时间顺序
十进制到二进制
#2 回复于2022-02

你说是类似苏剑林大佬的这篇吗:https://spaces.ac.cn/archives/8444 。不支持,需要自己实现。

0
回复
CarryOnGoing
#3 回复于2022-02
你说是类似苏剑林大佬的这篇吗:https://spaces.ac.cn/archives/8444 。不支持,需要自己实现。

不是,梯度检查点是跟混合精度、梯度累加一样,用于小显存训练大模型的技巧

0
回复
beyondyourself
#4 回复于2022-02

混合精度支持

0
回复
fi_Past
#5 回复于2022-03

梯度检查得自己做吧

0
回复
CarryOnGoing
#7 回复于2022-03

已在官方API下面找到了:

https://www.paddlepaddle.org.cn/documentation/docs/zh/api/paddle/distributed/fleet/utils/recompute_cn.html#recompute

0
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户