de/df6/data_2build_8py_source.html

# encoding: utf-8

"""

@author:  l1aoxingyu

@contact: sherlockliao01@gmail.com

"""


import os

import torch

from torch._six import string_classes

int_classes = int

from collections import abc as container_abcs

from torch.utils.data import DataLoader

from fastreid.utils import comm


from . import samplers

from .common import CommDataset, LMDBDataset, KidDataset

from .datasets import DATASET_REGISTRY

from .transforms import build_transforms


def parser_kwargs(additional_args):

    kwargs = {}

    if len(additional_args):

        args = [x.strip() for x in additional_args.split('+')]

        for arg in args:

            key, value = [x.strip() for x in arg.split(':')]

            if '.' in value and value.replace('.', '').isdigit():

                kwargs[key] = float(value)

            elif 'e-' in value and value.replace('e-', '').isdigit():

                kwargs[key] = float(value)

            elif 'e' in value and value.replace('e', '').isdigit():

                kwargs[key] = float(value)

            elif value.isdigit():

                kwargs[key] = int(value)

            else:

                kwargs[key] = value

    return kwargs


def build_reid_train_loader(cfg):

    cfg = cfg.clone()

    cfg.defrost()


    train_items = list()

    for d in cfg.DATASETS.NAMES:

        kwargs = parser_kwargs(cfg.DATASETS.KWARGS)

        dataset = DATASET_REGISTRY.get(d)(root=cfg.DATASETS.ROOT,

                        combineall=cfg.DATASETS.COMBINEALL, **kwargs)

        if comm.is_main_process():

            dataset.show_train()

        train_items.extend(dataset.train)


    iters_per_epoch = len(train_items) // cfg.SOLVER.IMS_PER_BATCH

    cfg.SOLVER.MAX_ITER *= iters_per_epoch

    train_transforms = build_transforms(cfg, is_train=True)

    if not cfg.DATASETS.IS_LMDB:

        train_set = CommDataset(train_items, train_transforms, relabel=True)

    else:

        train_set = LMDBDataset(dataset, train_transforms)


    num_workers = cfg.DATALOADER.NUM_WORKERS

    num_instance = cfg.DATALOADER.NUM_INSTANCE

    mini_batch_size = cfg.SOLVER.IMS_PER_BATCH // comm.get_world_size()


    if cfg.DATALOADER.PK_SAMPLER:

        if cfg.DATALOADER.NAIVE_WAY:

            data_sampler = samplers.NaiveIdentitySampler(train_set.img_items,

                                                         cfg.SOLVER.IMS_PER_BATCH, num_instance)

        else:

            data_sampler = samplers.BalancedIdentitySampler(train_set.img_items,

                                                            cfg.SOLVER.IMS_PER_BATCH, num_instance)

    else:

        data_sampler = samplers.TrainingSampler(len(train_set))

    batch_sampler = torch.utils.data.sampler.BatchSampler(data_sampler, mini_batch_size, True)


    train_loader = torch.utils.data.DataLoader(

        train_set,

        num_workers=num_workers,

        batch_sampler=batch_sampler,

        collate_fn=fast_batch_collator,

        pin_memory=True,

    )

    return train_loader


def build_reid_test_loader(cfg, dataset_name):

    cfg = cfg.clone()

    cfg.defrost()


    kwargs = parser_kwargs(cfg.DATASETS.KWARGS)

    dataset = DATASET_REGISTRY.get(dataset_name)(root=cfg.DATASETS.ROOT, **kwargs)


    if comm.is_main_process():

        dataset.show_test()

    test_items = dataset.query + dataset.gallery


    print(f'test_items = {test_items}\n')


    test_transforms = build_transforms(cfg, is_train=False)


    print(f'test_transforms = {test_transforms}\n')


    test_set = CommDataset(test_items, test_transforms, relabel=False)


    print(f'test_set = {test_set}\n')


    mini_batch_size = cfg.TEST.IMS_PER_BATCH // comm.get_world_size()


    print(f'mini_batch_size = {mini_batch_size}\n')


    data_sampler = samplers.InferenceSampler(len(test_set))

    batch_sampler = torch.utils.data.BatchSampler(data_sampler, mini_batch_size, False)

    test_loader = DataLoader(

        test_set,

        batch_sampler=batch_sampler,

        num_workers=4,  # save some memory

        collate_fn=fast_batch_collator,

        pin_memory=True,

    )

    return test_loader, len(dataset.query)


def build_kid_reid_test_loader(cfg, test_items):

    cfg = cfg.clone()

    cfg.defrost()


    test_transforms = build_transforms(cfg, is_train=False)


    test_set = KidDataset(test_items, test_transforms, relabel=False)


    mini_batch_size = cfg.TEST.IMS_PER_BATCH // comm.get_world_size()


    data_sampler = samplers.InferenceSampler(len(test_set))

    batch_sampler = torch.utils.data.BatchSampler(data_sampler, mini_batch_size, False)

    test_loader = DataLoader(

        test_set,

        batch_sampler=batch_sampler,

        num_workers=4,  # save some memory

        collate_fn=fast_batch_collator,

        pin_memory=True,

    )

    return test_loader


def trivial_batch_collator(batch):

    """

    A batch collator that does nothing.

    """

    return batch


def fast_batch_collator(batched_inputs):

    """

    A simple batch collator for most common reid tasks

    """

    elem = batched_inputs[0]

    if isinstance(elem, torch.Tensor):

        out = torch.zeros((len(batched_inputs), *elem.size()), dtype=elem.dtype)

        for i, tensor in enumerate(batched_inputs):

            out[i] += tensor

        return out


    elif isinstance(elem, container_abcs.Mapping):

        return {key: fast_batch_collator([d[key] for d in batched_inputs]) for key in elem}


    elif isinstance(elem, float):

        return torch.tensor(batched_inputs, dtype=torch.float64)

    elif isinstance(elem, int_classes):

        return torch.tensor(batched_inputs)

    elif isinstance(elem, string_classes):

        return batched_inputs


fastreid.data.common.CommDataset
Definition common.py:15

fastreid.data.common.KidDataset
Definition common.py:60

fastreid.data.common.LMDBDataset
Definition common.py:104

fastreid.data.samplers.data_sampler.InferenceSampler
Definition data_sampler.py:58

fastreid.data.samplers.data_sampler.TrainingSampler
Definition data_sampler.py:15

fastreid.data.samplers.triplet_sampler.BalancedIdentitySampler
Definition triplet_sampler.py:23

fastreid.data.samplers.triplet_sampler.NaiveIdentitySampler
Definition triplet_sampler.py:101

fastreid.data.build.fast_batch_collator
fast_batch_collator(batched_inputs)
Definition build.py:151

fastreid.data.build.trivial_batch_collator
trivial_batch_collator(batch)
Definition build.py:144

fastreid.data.build.build_kid_reid_test_loader
build_kid_reid_test_loader(cfg, test_items)
Definition build.py:122

fastreid.data.build.build_reid_test_loader
build_reid_test_loader(cfg, dataset_name)
Definition build.py:85

fastreid.data.build.parser_kwargs
parser_kwargs(additional_args)
Definition build.py:20

fastreid.data.build.build_reid_train_loader
build_reid_train_loader(cfg)
Definition build.py:39

fastreid.utils
Definition __init__.py:1

torch.utils.data