首页 Paddle框架 帖子详情
从优化算法角度看,像layers.elementwise_max, layers.clip这些不可导的op是如何被计算导数,并参与梯度优化过程的?
收藏
快速回复
Paddle框架 问答深度学习 689 1
从优化算法角度看,像layers.elementwise_max, layers.clip这些不可导的op是如何被计算导数,并参与梯度优化过程的?
收藏
快速回复
Paddle框架 问答深度学习 689 1

比如下面这些代码,来自如下链接代码中的182行:https://github.com/PaddlePaddle/PARL/blob/develop/parl/algorithms/fluid/ppo.py

        pg_ratio = layers.exp(logprob - old_logprob)
        clipped_pg_ratio = layers.clip(pg_ratio, 1 - self.epsilon,
                                       1 + self.epsilon)
        surrogate_loss = layers.elementwise_min(
            advantages * pg_ratio, advantages * clipped_pg_ratio)
        loss = 0 - layers.reduce_mean(surrogate_loss)
0
收藏
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户