感谢大家访问本站，希望本站的内容可以帮助到大家！
如果觉得本站的内容有帮助，可以考虑打赏博主哦！
计算机图形学与计算几何经典必备书单整理，下载链接可参考：https://www.stubbornhuang.com/1256/
本站会放置Google广告用于维持域名以及网站服务器费用。
问题反馈可发送邮件到stubbornhuang@qq.com
欢迎大家交换友链，可在https://www.stubbornhuang.com/申请友情链接进行友链交换申请！
在本站开通年度VIP，无限制下载本站资源和阅读本站文章
本站由于前段时间遭受到大量临时和国外邮箱注册，所以对可注册的邮箱类型进行了限制！
工资「喂饱肚子」，副业「养活灵魂」！

Pytorch – torch.distributed.init_process_group函数详解

StubbornHuang Pytorch 发布于2022-08-29 阅读 4,411次 0次评论 0次点赞本文共832个字，阅读需要3分钟。

在pytorch中使用torch.nn.parallel.DistributedDataParallel进行分布式训练时，需要使用torch.distributed.init_process_group()初始化torch.nn.parallel.DistributedDataParallel包。

1 torch.distributed.init_process_group

1. 函数形式

torch.distributed.init_process_group(backend, init_method=None, timeout=datetime.timedelta(seconds=1800), world_size=-1, rank=-1, store=None, group_name='')

2. 函数功能

初始化默认的分布式进程组，同时初始化分布式包。

3. 函数参数

backend：类型为str或者Backend，必需参数。所使用的Backend。可选值为mpi，gloo，nccl。我们可以通过小写的字符串如"gloo"指定该字段的值，也可以通过Backend.GLOO设置该字段的值；
init_method：类型为str，可选参数。指定如何初始化进程组的url。如果没有指定参数init_method或者store，则使用默认值env://；
world_size：类型为int，可选参数。参与分布式训练的进程数。如果指定了参数store，则为必需参数。默认值为-1；
rank：类型为int，可选参数。当前进程的序号（范围为0到world_size-1）之间。如果指定了参数store，则为必需参数。默认值为-1；
store：类型为Store，可选参数。所有的工作进程都可以访问的键/值store，用于交换连接/地址信息；
group_name：类型为str，可选参数。进程组名称；
timeout：类型为timedelta，可选参数。对进程组指定的操作超时，默认值为30分钟；

欢迎扫码关注我的微信公众号，及时获取文章更新

本文作者：StubbornHuang

原文标题：Pytorch – torch.distributed.init_process_group函数详解

原文链接：https://www.stubbornhuang.com/2327/

发布于：2022年08月29日 8:43:06

修改于：2023年06月21日 18:11:23

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

关键字：

文章末尾

工具软件网站

工具软件 - 使用Potplayer录制在线直播视频流

工具软件网站

发表评论点击这里取消回复。

您必须 [ 登录 ] 才能发表留言！

Pytorch – torch.distributed.init_process_group函数详解

1 torch.distributed.init_process_group

发表评论点击这里取消回复。

联系我

资助我们

随机推荐

资源分享 – Real-Time 3D Character Animation with Visual C++ 英文PDF下载

OnnxRuntime – 模型部署笔记3，总结OnnxRuntime模型推理流程

C++ – 在CTC解码算法后移除相邻重复和blank索引

视频显著性检测模型性能排行榜

资源分享 – Artificial Intelligence – A Modern Approach , First Edition 英文PDF下载

工具网站推荐 – 获取本机外网IP

最新评论

Pytorch – torch.distributed.init_process_group函数详解

1 torch.distributed.init_process_group

发表评论 点击这里取消回复。

联系我

资助我们

随机推荐

资源分享 – Real-Time 3D Character Animation with Visual C++ 英文PDF下载

OnnxRuntime – 模型部署笔记3，总结OnnxRuntime模型推理流程

C++ – 在CTC解码算法后移除相邻重复和blank索引

视频显著性检测模型性能排行榜

资源分享 – Artificial Intelligence – A Modern Approach , First Edition 英文PDF下载

工具网站推荐 – 获取本机外网IP

最新评论

大家都在搜

关注我们的公众号

发表评论点击这里取消回复。