首页 Paddle框架 帖子详情
怎样在本地测试Fleet API实现的分布式训练代码是否正确? 已解决
收藏
快速回复
Paddle框架 问答模型训练 418 1
怎样在本地测试Fleet API实现的分布式训练代码是否正确? 已解决
收藏
快速回复
Paddle框架 问答模型训练 418 1

怎样在本地测试Fleet API实现的分布式训练代码是否正确?

旧鸱c_
已解决
2# 回复于2021-08
首先写好分布式train.py文件 在PServer模式下,命令行模拟启动分布式:python -m paddle.distributed.launch_ps --worker_num 2 --server_num 2 train.py 在Collective模式下,命令改为python -m paddle.distributed.launch --gpus=0,1 train.py
展开
0
收藏
回复
全部评论(1)
时间顺序
旧鸱c_
#2 回复于2021-08

首先写好分布式train.py文件

在PServer模式下,命令行模拟启动分布式:python -m paddle.distributed.launch_ps --worker_num 2 --server_num 2 train.py
在Collective模式下,命令改为python -m paddle.distributed.launch --gpus=0,1 train.py

0
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户