NVIDIA presenta su técnica para reconstruir fotos con IA

Palabras clave

Contenido patrocinado: 
NVIDIA presenta su técnica para reconstruir fotos con IA
Autor:
La empresa se convierte en la primera en demostrar la eficacia de la imagen de aprendizaje profundo en modelos de impainting para orificios de forma irregular
Aprendizaje Profundo

Nvidia introdujo un método de aprendizaje profundo que puede editar imágenes o reconstruir una imagen dañada, ya sea que esté perforada o le falten píxeles, el cual también podría implementarse en softwares de edición fotográfica para eliminar el contenido no deseado y reemplazarlo con una alternativa realista generada por computadora.

Utilizando las GPU NVIDIA Tesla V100 y el marco de aprendizaje profundo Py Torch acelerado por cuDNN, se entrenó la red neuronal aplicando las máscaras generadas a las imágenes de los conjuntos de datos ImageNet, Places2 y CelebA-HQ. Primero se generaron 55.116 máscaras de rayas aleatorias y agujeros de formas y tamaños arbitrarios, así como casi 25.000 otras máscaras para realizar pruebas. Estos se identificaron en seis categorías según los tamaños relativos a la imagen de entrada, con el fin de mejorar la precisión de la reconstrucción.

Los métodos existentes de impainting para imágenes basados en el aprendizaje profundo sufren porque el valor resultante para los píxeles faltantes necesariamente depende del valor de la entrada que se debe suministrar a la red neuronal para completarlos, ocasionando discrepancias de color y borrosidad en las imágenes.

Por ello, este nuevo método garantiza que los valores resultantes de los píxeles faltantes no dependan del valor de entrada proporcionado para esos píxeles, ya que hace uso de una capa de "convolución parcial" que re-normaliza cada resultado dependiendo de la validez de su campo receptivo correspondiente.

Cabe destacar que el modelo se construye a partir de una arquitectura UNet implementada con estas convoluciones parciales. Un conjunto de funciones de pérdida, la coincidencia de pérdidas de características con un modelo VGG, así como las pérdidas de estilo, se utilizaron para capacitar al modelo para producir resultados realistas.

Contenido relacionado:

¡ Déjanos un comentario !