web-dev-qa-db-fra.com

Quelles sont les valeurs possibles pour data_augmentation_options dans la configuration du pipeline de détection d'objet TensorFlow?

J'ai formé avec succès un modèle de détection d'objet avec TensorFlow avec les exemples de configuration donnés ici: https://github.com/tensorflow/models/tree/master/object_detection/samples/configs

Maintenant, je souhaite peaufiner ma configuration pour obtenir de meilleurs résultats. L'une des options prometteuses que je vois ici est "data_augmentation_options" sous "train_config". Actuellement, cela ressemble à ceci:

train_config: {
  batch_size: 1
  ...
  data_augmentation_options {
    random_horizontal_flip {
    }
  }
}

Existe-t-il d'autres options pour effectuer une mise à l'échelle aléatoire, un rognage ou un réglage de la luminosité?

32
privard

La liste des options est fournie dans preprocessor.proto :

NormalizeImage normalize_image = 1;
RandomHorizontalFlip random_horizontal_flip = 2;
RandomPixelValueScale random_pixel_value_scale = 3;
RandomImageScale random_image_scale = 4;
RandomRGBtoGray random_rgb_to_gray = 5;
RandomAdjustBrightness random_adjust_brightness = 6;
RandomAdjustContrast random_adjust_contrast = 7;
RandomAdjustHue random_adjust_hue = 8;
RandomAdjustSaturation random_adjust_saturation = 9;
RandomDistortColor random_distort_color = 10;
RandomJitterBoxes random_jitter_boxes = 11;
RandomCropImage random_crop_image = 12;
RandomPadImage random_pad_image = 13;
RandomCropPadImage random_crop_pad_image = 14;
RandomCropToAspectRatio random_crop_to_aspect_ratio = 15;
RandomBlackPatches random_black_patches = 16;
RandomResizeMethod random_resize_method = 17;
ScaleBoxesToPixelCoordinates scale_boxes_to_pixel_coordinates = 18;
ResizeImage resize_image = 19;
SubtractChannelMean subtract_channel_mean = 20;
SSDRandomCrop ssd_random_crop = 21;
SSDRandomCropPad ssd_random_crop_pad = 22;
SSDRandomCropFixedAspectRatio ssd_random_crop_fixed_aspect_ratio = 23;

Vous pouvez voir les détails de chaque option dans preprocessor.py . Les arguments peuvent être fournis sous forme de paires clé-valeur.

  data_augmentation_options {
    ssd_random_crop {
    }
  }
  data_augmentation_options {
    random_pixel_value_scale {
      minval: 0.6
    }
  }
48
Najih Km