从优化算法角度看，像layers.elementwise_max, layers.clip这些不可导的op是如何被计算导数，并参与梯度优化过程的？

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

AIStudio792065 发布于2020-02

比如下面这些代码，来自如下链接代码中的182行：https://github.com/PaddlePaddle/PARL/blob/develop/parl/algorithms/fluid/ppo.py

        pg_ratio = layers.exp(logprob - old_logprob)
        clipped_pg_ratio = layers.clip(pg_ratio, 1 - self.epsilon,
                                       1 + self.epsilon)
        surrogate_loss = layers.elementwise_min(
            advantages * pg_ratio, advantages * clipped_pg_ratio)
        loss = 0 - layers.reduce_mean(surrogate_loss)

全部评论(1)

AIStudio784542

#2 回复于2020-02

可以参考这些op的反向实现。
https://github.com/PaddlePaddle/Paddle/blob/develop/paddle/fluid/operators/elementwise/elementwise_max_op.h
https://github.com/PaddlePaddle/Paddle/blob/develop/paddle/fluid/operators/clip_op.h

提issue

需求/bug反馈？一键提issue告诉我们

提pr

发现bug？如果您知道修复办法，欢迎提pr直接参与建设飞桨~