鲲鹏社区首页
中文
注册
开发者
我要评分
获取效率
正确性
完整性
易理解
在线提单
论坛求助

Conv

接口功能

Conv2D卷积操作:提取图像/特征图的局部空间特征。

Conv3D对三维体积数据执行卷积操作,提取时空特征。

函数原型

torch.nn.Conv2d(
    in_channels: int,
    out_channels: int,
    kernel_size: Union[int, Tuple[int, int]],
    stride: Union[int, Tuple[int, int]] = 1,
    padding: Union[str, int, Tuple[int, int]] = 0,
    dilation: Union[int, Tuple[int, int]] = 1,
    groups: int = 1,
    bias: bool = True,
    padding_mode: str = 'zeros',
    device=None,
    dtype=None
)
torch.nn.Conv3d(
    in_channels: int,
    out_channels: int,
    kernel_size: Union[int, Tuple[int, int, int]],
    stride: Union[int, Tuple[int, int, int]] = 1,
    padding: Union[str, int, Tuple[int, int, int]] = 0,
    dilation: Union[int, Tuple[int, int, int]] = 1,
    groups: int = 1,
    bias: bool = True,
    padding_mode: str = 'zeros',
    device=None,
    dtype=None
)

参数说明

表1 Conv2D参数说明

参数

类型

必填

说明

in_channels

int

输入通道数。

out_channels

int

输出通道数(卷积核数量)。

kernel_size

int/tuple

卷积核尺寸(如3或 (3,3))。

stride

int/tuple

滑动步长(默认1)。

padding

int/tuple/str

边界填充(默认0,支持“same”等)。

dilation

int/tuple

空洞卷积率(默认1)。

groups

int

分组卷积数(默认1,in_channels需被整除)。

bias

bool

是否添加偏置(默认True)。

padding_mode

str

填充模式("zeros", "reflect", "replicate", "circular")。

表2 Conv3d

参数

类型

必填

说明

in_channels

int

输入体积数据的通道数(如RGB视频为3)。

out_channels

int

输出通道数(卷积核数量)。

kernel_size

int/tuple

三维卷积核尺寸(如(3,3,3)或单值5)。

stride

int/tuple

三维滑动步长(默认(1,1,1))。

padding

int/tuple/str

三维边界填充(默认0,支持"same")。

dilation

int/tuple

三维空洞卷积率(默认1)。

groups

int

分组卷积数(默认1)。

bias

bool

是否添加偏置(默认True)。

padding_mode

str

填充模式("zeros", "reflect", "replicate", "circular")。