首页 Paddle框架 帖子详情
集合通信Collective模式报参数未初始化的错误是什么原因? 已解决
收藏
快速回复
Paddle框架 问答深度学习 324 1
集合通信Collective模式报参数未初始化的错误是什么原因? 已解决
收藏
快速回复
Paddle框架 问答深度学习 324 1

集合通信Collective模式报参数未初始化的错误是什么原因?

旧鸱c_
已解决
2# 回复于2021-08
2.0版本需要严格先run(startup_program),然后再调用fleet.init_worker()启动worker端通信相关,并将0号worker的参数广播出去完成其他节点的初始化。先init_worker,再run(startup_program),会报参数未初始化的错误 2.0之前的版本是在server端做初始化,无需0号节点广播,所以init_worker()可以在run(startup_program)执行。
展开
0
收藏
回复
全部评论(1)
时间顺序
旧鸱c_
#2 回复于2021-08

2.0版本需要严格先run(startup_program),然后再调用fleet.init_worker()启动worker端通信相关,并将0号worker的参数广播出去完成其他节点的初始化。先init_worker,再run(startup_program),会报参数未初始化的错误
2.0之前的版本是在server端做初始化,无需0号节点广播,所以init_worker()可以在run(startup_program)执行。

0
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户