Notas de pytorch 01: amplificación de datos
El aumento de datos es una forma efectiva de aumentar el tamaño de la muestra de sus datos. El aprendizaje profundo es un método basado en big data. En la actualidad, esperamos que cuanto mayor sea la escala y mayor sea la calidad de los datos, mejor. Un modelo de este tipo puede tener una mejor capacidad de generalización, pero los datos reales recopilados a menudo son difíciles de cubrir todas las escenas. Por ejemplo, para las condiciones de iluminación, es difícil controlar la relación de iluminación al recopilar datos de imágenes, por lo que al entrenar el modelo. Es necesario agregar datos de mejora de los cambios de iluminación. Otro aspecto es que la recopilación de datos también requiere un gran costo. Si se pueden generar automáticamente varios datos de capacitación, se pueden aumentar mejor los ingresos y reducir los gastos.
La mejora de datos se puede dividir en dos categorías, una es mejora fuera de línea y la otra es mejora en línea.
Los métodos de aumento de datos comunes en pytorch son los siguientes:
Las transformaciones integradas en torchvision incluyen estas transformaciones de imágenes comunes, que se pueden combinar en serie con Compose. Escala de grises (num_output_channels=1))
clase torchvision.transforms.Pad(padding, fill=0, padding_mode='constant')
clase torchvision.transforms.Pad(padding, fill =0, padding_mode='constante')