本站会放置Google广告用于维持域名以及网站服务器费用。
在本站开通年度VIP，无限制下载本站资源和阅读本站文章
问题反馈可发送邮件到stubbornhuang@qq.com
感谢大家访问本站，希望本站的内容可以帮助到大家！
如果觉得本站的内容有帮助，可以考虑打赏博主哦！
工资「喂饱肚子」，副业「养活灵魂」！
欢迎大家交换友链，可在https://www.stubbornhuang.com/申请友情链接进行友链交换申请！
本站由于前段时间遭受到大量临时和国外邮箱注册，所以对可注册的邮箱类型进行了限制！
计算机图形学与计算几何经典必备书单整理，下载链接可参考：https://www.stubbornhuang.com/1256/

Pytorch – torch.nn.Conv2d参数详解与使用

StubbornHuang Pytorch 发布于2022-12-07 阅读 6,314次 0次评论 0次点赞本文共1801个字，阅读需要5分钟。

1 torch.nn.Conv2d

torch.nn.Conv2d主要对输入Tensor应用2D卷积。

比如输入 $(N,C_{in},H,W)$ 维度的Tensor，则输出 $(N,C_{out},H,W)$ 的Tensor，这两者的关系可以描述为

\operatorname{out}\left(N_{i}, C_{\text {out }_{j}}\right)=\operatorname{bias}\left(C_{\text {out }_{j}}\right)+\sum_{k=0}^{C_{\text {in }}-1} \operatorname{weight}\left(C_{\text {out }_{j}}, k\right) \star \operatorname{input}\left(N_{i}, k\right)

其中， $\star$ 为2D cross-correlation操作， $N$ 为batch size， $C$ 为channels， $H$ 为高， $W$ 为宽。

1.1 torch.nn.Conv2d

形式

torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True, padding_mode='zeros', device=None, dtype=None)

参数

in_channels(int)：输入的特征维度
out_channels(int)：输出的特征维度
kernel_size(int or tuple)：卷积核大小
stride(int or tuple)：卷积的步幅，默认值为1
padding(int or tuple)：添加到输入两侧的零填充数量，默认值为0
dilation(int or tuple)：内核元素之间的间距，默认值为1
groups(int)：从输入通道到输出通道的阻塞连接数
bias(bool)：默认值为True，如果为True，则向输出添加可学习的偏差
padding_mode(str)：可选值为"zeros"、"reflect"、"replicate"、“circular”，默认值为"zeros"

输入与输出维度

一般，输入与输出tensor具有以下维度：

input： $(N,C_{in},H_{in},W_{in})$ 或者 $(C_{in},H_{in},W_{in})$
output： $(N,C_{out},H_{out},W_{out})$ 或者 $(C_{out},H_{out},W_{out})$

其中，

H_{\text {out }}=\left\lfloor\frac{H_{\text {in }}+2 \times \text { padding[0] }-\text { dilation[0] } \times(\text { kernelsize[0] }-1)-1}{\text { stride[0] }}+1\right\rfloor

W_{\text {out }}=\left\lfloor\frac{W_{\text {in }}+2 \times \text { padding[1] }-\text { dilation[1] } \times(\text { kernelsize[1] }-1)-1}{\text { stride[1] }}+1\right\rfloor

1.2 torch.nn.Conv2d的简单使用

假设有batch_size为10，in_channels特征维度为256，宽高都为224的输入tensor，使用卷积核大小为3，卷积步幅为1的二维卷积层对输入tensor进行卷积，

对应的pytorch代码如下：

import torch

if __name__ == '__main__':
    batch_size = 10
    in_channels = 256
    h = 224
    w = 224
    out_channels = 512

    input = torch.randn(size=(batch_size, in_channels, h, w))
    conv2d = torch.nn.Conv2d(in_channels=in_channels, out_channels=out_channels, kernel_size=3)
    out = conv2d(input)

    print(out.shape)

输出

torch.Size([10, 512, 222, 222])

欢迎扫码关注我的微信公众号，及时获取文章更新

本文作者：StubbornHuang

原文标题：Pytorch – torch.nn.Conv2d参数详解与使用

原文链接：https://www.stubbornhuang.com/2436/

发布于：2022年12月07日 13:10:14

修改于：2023年06月21日 17:45:57

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

关键字：

文章末尾

TensorRT - onnx_graphsurgeon工具库的安装与API简介

TensorRT

Pytorch - 创建随机Tensor的常用方法

Pytorch

发表评论点击这里取消回复。

您必须 [ 登录 ] 才能发表留言！

Pytorch – torch.nn.Conv2d参数详解与使用

1 torch.nn.Conv2d

1.1 torch.nn.Conv2d

1.2 torch.nn.Conv2d的简单使用

发表评论点击这里取消回复。

联系我

资助我们

随机推荐

资源分享 – The Art of Fluid Animation 英文PDF下载

深度学习 – NLP自然语言处理与语音识别中常用的标识符等的含义

资源分享 – 解读基金：我的投资观与实践（季凯帆，康峰著）PDF下载

深度学习 – 语音识别框架wenet中的CTC Prefix Beam Search算法的实现

NCNN – Windows编译NCNN项目出现无法打开包括文件vulkan.h的错误

Pytorch – torch.distributed.init_process_group函数详解

最新评论

Pytorch – torch.nn.Conv2d参数详解与使用

1 torch.nn.Conv2d

1.1 torch.nn.Conv2d

1.2 torch.nn.Conv2d的简单使用

发表评论 点击这里取消回复。

联系我

资助我们

随机推荐

资源分享 – The Art of Fluid Animation 英文PDF下载

深度学习 – NLP自然语言处理与语音识别中常用的标识符等的含义

资源分享 – 解读基金：我的投资观与实践（季凯帆，康峰著）PDF下载

深度学习 – 语音识别框架wenet中的CTC Prefix Beam Search算法的实现

NCNN – Windows编译NCNN项目出现无法打开包括文件vulkan.h的错误

Pytorch – torch.distributed.init_process_group函数详解

最新评论

大家都在搜

关注我们的公众号

发表评论点击这里取消回复。