集合通信Collective模式报参数未初始化的错误是什么原因?
2.0版本需要严格先run(startup_program),然后再调用fleet.init_worker()启动worker端通信相关,并将0号worker的参数广播出去完成其他节点的初始化。先init_worker,再run(startup_program),会报参数未初始化的错误2.0之前的版本是在server端做初始化,无需0号节点广播,所以init_worker()可以在run(startup_program)执行。
2.0版本需要严格先run(startup_program),然后再调用fleet.init_worker()启动worker端通信相关,并将0号worker的参数广播出去完成其他节点的初始化。先init_worker,再run(startup_program),会报参数未初始化的错误
2.0之前的版本是在server端做初始化,无需0号节点广播,所以init_worker()可以在run(startup_program)执行。