da/d5d/resnet3d_8py_source.html

from typing import Dict, List, Optional, Sequence, Tuple, Union


import torch

import torch.nn as nn

from torch.nn.modules.utils import _ntuple, _triple


class Bottleneck3d(nn.Module):


    expansion = 4


    def __init__(self,

                 inplanes: int,

                 planes: int,

                 spatial_stride: int = 1,

                 temporal_stride: int = 1,

                 dilation: int = 1,

                 downsample: Optional[nn.Module] = None,

                 inflate: bool = True,

                 inflate_style: str = '3x1x1') -> None:

        super().__init__()


        self.inplanes = inplanes

        self.planes = planes

        self.spatial_stride = spatial_stride

        self.temporal_stride = temporal_stride

        self.dilation = dilation


        self.inflate = inflate

        self.inflate_style = inflate_style


        self.conv1_stride_s = 1

        self.conv2_stride_s = spatial_stride

        self.conv1_stride_t = 1

        self.conv2_stride_t = temporal_stride


        conv1_stride = (self.conv1_stride_t, self.conv1_stride_s, self.conv1_stride_s)

        conv2_stride = (self.conv2_stride_t, self.conv2_stride_s, self.conv2_stride_s)


        if self.inflate:

            if inflate_style == '3x1x1':

                conv1_kernel_size = (3, 1, 1)

                conv1_padding = (1, 0, 0)

                conv2_kernel_size = (1, 3, 3)

                conv2_padding = (0, dilation, dilation)

            else:

                conv1_kernel_size = (1, 1, 1)

                conv1_padding = (0, 0, 0)

                conv2_kernel_size = (3, 3, 3)

                conv2_padding = (1, dilation, dilation)

        else:

            conv1_kernel_size = (1, 1, 1)

            conv1_padding = (0, 0, 0)

            conv2_kernel_size = (1, 3, 3)

            conv2_padding = (0, dilation, dilation)


        self.conv1 = nn.Sequential(nn.Conv3d(inplanes, planes, kernel_size=conv1_kernel_size, stride=conv1_stride, padding=conv1_padding, bias=False),

                                   nn.BatchNorm3d(planes),

                                   nn.ReLU(inplace=True))


        self.conv2 = nn.Sequential(nn.Conv3d(planes, planes, kernel_size=conv2_kernel_size, stride=conv2_stride, padding=conv2_padding, bias=False),

                                   nn.BatchNorm3d(planes),

                                   nn.ReLU(inplace=True))


        self.conv3 = nn.Sequential(nn.Conv3d(planes, planes * self.expansionexpansion, kernel_size=1, bias=False),

                                   nn.BatchNorm3d(planes * self.expansionexpansion))


        self.downsample = downsample

        self.relu = nn.ReLU(inplace=True)


    def forward(self, x):


        identity = x


        out = self.conv1(x)

        out = self.conv2(out)

        out = self.conv3(out)


        if self.downsample is not None:

            identity = self.downsample(x)


        out = out + identity


        out = self.relu(out)


        return out


class ResNet3d(nn.Module):

    """

    3D conv기반의 Resnet

    mmaction2의 slowonly를 기반으로함

    """


    def __init__(self,

                 in_channels: int = 17,

                 base_channels: int = 64,

                 stage_blocks: Optional[Tuple] = (4, 6, 3),

                 out_indices: Sequence[int] = (2, ),

                 spatial_strides: Sequence[int] = (2, 2, 2),

                 temporal_strides: Sequence[int] = (1, 1, 2),

                 dilations: Sequence[int] = (1, 1, 1),

                 conv1_kernel: Sequence[int] = (1, 7, 7),

                 conv1_stride_s: int = 1,

                 conv1_stride_t: int = 1,

                 pool1_stride_s: int = 1,

                 pool1_stride_t: int = 1,

                 inflate: Sequence[int] = (0, 1, 1),

                 inflate_style: str = '3x1x1',

                 input_key = 'keypoint_heatmap',

                 **kwargs) -> None:

        super().__init__()

        """

        args:

            in_channels (int) : 입력 채널

            base_channels (int) : 초기 conv의 출력 채널, base_channels의 배수로 conv 블럭들의 출력 채널이 결정됨

            stage_blocks (tuple) : 각 스테이지에서 반복하는 블럭수

            out_indices (Sequence[int]) : 출력 하려는 특징 스테이지 인덱스

            spatial_strides (Sequence[int]) : 각 스테이지별 공간축 stride

            temporal_strides (Sequence[int]) : 각 스테이지별 시간축 stride

            dilations (Sequence[int]) : 각 스테이지별 dilation

            conv1_kernel (Sequence[int]) : 초기 conv의 커널 shape

            conv1_stride_s (int) : 초기 conv의 공간축 stride

            conv1_stride_t (int) : 초기 conv의 시간축 stride

            pool1_stride_s (int) : 초기 conv이후의 풀링 레이어의 공간축 stride

            pool1_stride_t (int) : 초기 conv이후의 풀링 레이어의 시간축 stride

            inflate (Sequence[int]) : 블럭의 conv 커널 타입 설정

            inflate_style (str) : 블럭의 conv 커널 타입 설정

                TODO : inflate_style을 추가해서 커널 종류를 다양하게 사용해 볼 수 있음

            input_key (str) : 모듈의 inference에서 사용하는 입력데이터의 키값

        """

        self.input_key = input_key


        self.in_channels = in_channels

        self.base_channels = base_channels

        self.num_stages = len(stage_blocks)

        self.stage_blocks = stage_blocks

        self.out_indices = out_indices

        assert max(out_indices) < self.num_stages

        self.spatial_strides = spatial_strides

        self.temporal_strides = temporal_strides

        self.dilations = dilations

        assert len(spatial_strides) == len(temporal_strides) == len(

            dilations) == self.num_stages


        self.conv1_kernel = conv1_kernel

        self.conv1_stride_s = conv1_stride_s

        self.conv1_stride_t = conv1_stride_t

        self.pool1_stride_s = pool1_stride_s

        self.pool1_stride_t = pool1_stride_t

        self.stage_inflations = inflate

        self.inflate_style = inflate_style


        self.block = Bottleneck3d


        self.inplanes = self.base_channels


        self.conv1_stride = (self.conv1_stride_t, self.conv1_stride_s, self.conv1_stride_s)

        self.conv1_padding = tuple([(k - 1) // 2 for k in _triple(self.conv1_kernel)])

        self.pool1_stride = (self.pool1_stride_t, self.pool1_stride_s, self.pool1_stride_s)


        self._make_stem_layer()


        self.res_layers = []

        for i, num_blocks in enumerate(self.stage_blocks):

            spatial_stride = spatial_strides[i]

            temporal_stride = temporal_strides[i]

            dilation = dilations[i]

            planes = self.base_channels * 2**i

            res_layer = self.make_res_layer(

                self.block,

                self.inplanes,

                planes,

                num_blocks,

                spatial_stride=spatial_stride,

                temporal_stride=temporal_stride,

                dilation=dilation,

                inflate=self.stage_inflations[i],

                inflate_style=self.inflate_style,

                **kwargs)

            self.inplanes = planes * self.block.expansion

            layer_name = f'layer{i + 1}'

            self.add_module(layer_name, res_layer)

            self.res_layers.append(layer_name)


        # self.feat_dim = self.block.expansion * \

        #     self.base_channels * 2 ** (len(self.stage_blocks) - 1)


    @staticmethod


    def make_res_layer(block: nn.Module,

                       inplanes: int,

                       planes: int,

                       blocks: int,

                       spatial_stride: Union[int, Sequence[int]] = 1,

                       temporal_stride: Union[int, Sequence[int]] = 1,

                       dilation: int = 1,

                       inflate: Union[int, Sequence[int]] = 1,

                       inflate_style: str = '3x1x1',

                       **kwargs) -> nn.Module:


        inflate = inflate if not isinstance(inflate, int) \

            else (inflate,) * blocks


        downsample = None

        if spatial_stride != 1 or inplanes != planes * block.expansion:

            stride = (temporal_stride, spatial_stride, spatial_stride)

            downsample = nn.Sequential(nn.Conv3d(inplanes, planes * block.expansion, kernel_size=1, stride=stride, bias=False),

                                       nn.BatchNorm3d(planes * block.expansion))


        layers = []

        layers.append(

            block(

                inplanes,

                planes,

                spatial_stride=spatial_stride,

                temporal_stride=temporal_stride,

                dilation=dilation,

                downsample=downsample,

                inflate=(inflate[0] == 1),

                inflate_style=inflate_style,

                **kwargs))

        inplanes = planes * block.expansion

        for i in range(1, blocks):

            layers.append(

                block(

                    inplanes,

                    planes,

                    spatial_stride=1,

                    temporal_stride=1,

                    dilation=dilation,

                    inflate=(inflate[i] == 1),

                    inflate_style=inflate_style,

                    **kwargs))


        return nn.Sequential(*layers)


    def _make_stem_layer(self) -> None:


        self.conv1 = nn.Sequential(nn.Conv3d(self.in_channels, self.base_channels, kernel_size=self.conv1_kernel, stride=self.conv1_stride, padding=self.conv1_padding, bias=False),

                                   nn.BatchNorm3d(self.base_channels),

                                   nn.ReLU(inplace=True))


        self.maxpool = nn.MaxPool3d(kernel_size=(1, 3, 3), stride=self.pool1_stride, padding=(0, 1, 1))


    def forward(self, sample_dict):

        """

        args:

            sample (dict)) : 입력 데이터, self.input_key에 해당하는 키가 있어야함

                self.input_key의 아이템은 Tensor 타입 -> shape (B, C, T, H, W)

                    B : 배치 크기

                    C : 입력 채널

                    T : 시간


        return (Tensor):

            특정 해상도의 특징 벡터 -> shape (B, C_o, T_o, H_o, W_o)

                B : 배치 크기

                C_o : 채널

                T_o : 시간

        """

        x = sample_dict[self.input_key]


        x = self.conv1(x)

        x = self.maxpool(x)


        outs = []

        for i, layer_name in enumerate(self.res_layers):

            res_layer = getattr(self, layer_name)

            x = res_layer(x)


            if i in self.out_indices:

                outs.append(x)


        if len(outs) == 1:

            return outs[0]


        return tuple(outs)


resnet3d.Bottleneck3d
Definition resnet3d.py:7

resnet3d.Bottleneck3d.__init__
None __init__(self, int inplanes, int planes, int spatial_stride=1, int temporal_stride=1, int dilation=1, Optional[nn.Module] downsample=None, bool inflate=True, str inflate_style='3x1x1')
Definition resnet3d.py:19

resnet3d.Bottleneck3d.spatial_stride
spatial_stride
Definition resnet3d.py:24

resnet3d.Bottleneck3d.downsample
downsample
Definition resnet3d.py:68

resnet3d.Bottleneck3d.conv1
conv1
Definition resnet3d.py:57

resnet3d.Bottleneck3d.conv1_stride_t
conv1_stride_t
Definition resnet3d.py:33

resnet3d.Bottleneck3d.relu
relu
Definition resnet3d.py:69

resnet3d.Bottleneck3d.inplanes
inplanes
Definition resnet3d.py:22

resnet3d.Bottleneck3d.conv2_stride_s
conv2_stride_s
Definition resnet3d.py:32

resnet3d.Bottleneck3d.planes
planes
Definition resnet3d.py:23

resnet3d.Bottleneck3d.expansion
expansion
Definition resnet3d.py:66

resnet3d.Bottleneck3d.conv2_stride_t
conv2_stride_t
Definition resnet3d.py:34

resnet3d.Bottleneck3d.inflate_style
inflate_style
Definition resnet3d.py:29

resnet3d.Bottleneck3d.forward
forward(self, x)
Definition resnet3d.py:72

resnet3d.Bottleneck3d.conv2
conv2
Definition resnet3d.py:61

resnet3d.Bottleneck3d.conv3
conv3
Definition resnet3d.py:65

resnet3d.Bottleneck3d.conv1_stride_s
conv1_stride_s
Definition resnet3d.py:31

resnet3d.Bottleneck3d.temporal_stride
temporal_stride
Definition resnet3d.py:25

resnet3d.Bottleneck3d.expansion
int expansion
Definition resnet3d.py:9

resnet3d.Bottleneck3d.dilation
dilation
Definition resnet3d.py:26

resnet3d.Bottleneck3d.inflate
inflate
Definition resnet3d.py:28

resnet3d.ResNet3d
Definition resnet3d.py:90

resnet3d.ResNet3d.make_res_layer
nn.Module make_res_layer(nn.Module block, int inplanes, int planes, int blocks, Union[int, Sequence[int]] spatial_stride=1, Union[int, Sequence[int]] temporal_stride=1, int dilation=1, Union[int, Sequence[int]] inflate=1, str inflate_style='3x1x1', **kwargs)
Definition resnet3d.py:200

resnet3d.ResNet3d.inflate_style
inflate_style
Definition resnet3d.py:152

resnet3d.ResNet3d.__init__
None __init__(self, int in_channels=17, int base_channels=64, Optional[Tuple] stage_blocks=(4, 6, 3), Sequence[int] out_indices=(2,), Sequence[int] spatial_strides=(2, 2, 2), Sequence[int] temporal_strides=(1, 1, 2), Sequence[int] dilations=(1, 1, 1), Sequence[int] conv1_kernel=(1, 7, 7), int conv1_stride_s=1, int conv1_stride_t=1, int pool1_stride_s=1, int pool1_stride_t=1, Sequence[int] inflate=(0, 1, 1), str inflate_style='3x1x1', input_key='keypoint_heatmap', **kwargs)
Definition resnet3d.py:111

resnet3d.ResNet3d.block
block
Definition resnet3d.py:155

resnet3d.ResNet3d._make_stem_layer
None _make_stem_layer(self)
Definition resnet3d.py:239

resnet3d.ResNet3d.conv1
conv1
Definition resnet3d.py:241

resnet3d.ResNet3d.maxpool
maxpool
Definition resnet3d.py:245

resnet3d.ResNet3d.base_channels
base_channels
Definition resnet3d.py:135

resnet3d.ResNet3d.conv1_padding
conv1_padding
Definition resnet3d.py:160

resnet3d.ResNet3d.input_key
input_key
Definition resnet3d.py:132

resnet3d.ResNet3d.conv1_kernel
conv1_kernel
Definition resnet3d.py:146

resnet3d.ResNet3d.num_stages
num_stages
Definition resnet3d.py:136

resnet3d.ResNet3d.inplanes
inplanes
Definition resnet3d.py:157

resnet3d.ResNet3d.stage_inflations
stage_inflations
Definition resnet3d.py:151

resnet3d.ResNet3d.forward
forward(self, sample_dict)
Definition resnet3d.py:247

resnet3d.ResNet3d.conv1_stride_s
conv1_stride_s
Definition resnet3d.py:147

resnet3d.ResNet3d.pool1_stride
pool1_stride
Definition resnet3d.py:161

resnet3d.ResNet3d.res_layers
res_layers
Definition resnet3d.py:165

resnet3d.ResNet3d.out_indices
out_indices
Definition resnet3d.py:138

resnet3d.ResNet3d.conv1_stride
conv1_stride
Definition resnet3d.py:159

resnet3d.ResNet3d.dilations
dilations
Definition resnet3d.py:142

resnet3d.ResNet3d.pool1_stride_s
pool1_stride_s
Definition resnet3d.py:149

resnet3d.ResNet3d.stage_blocks
stage_blocks
Definition resnet3d.py:137

resnet3d.ResNet3d.conv1_stride_t
conv1_stride_t
Definition resnet3d.py:148

resnet3d.ResNet3d.in_channels
in_channels
Definition resnet3d.py:134

resnet3d.ResNet3d.spatial_strides
spatial_strides
Definition resnet3d.py:140

resnet3d.ResNet3d.pool1_stride_t
pool1_stride_t
Definition resnet3d.py:150

resnet3d.ResNet3d.temporal_strides
temporal_strides
Definition resnet3d.py:141

torch.nn