El contenido de este sitio se ha traducido mediante inteligencia artificial (IA) o tecnología de traducción automática, y puede contener errores.

Skip to content
Human Computer Interaction
Computer Vision

Modelización eficiente del flujo de datos de la codificación periférica en el sistema visual humano

Author

Rachel Brown (NVIDIA), Vasha DuTell (Berkeley y NVIDIA), Ruth Rozenholtz (MIT), Bruce Walter (CMU), David Luebke (NVIDIA), Peter Shirley (NVIDIA), Morgan McGuire (NVIDIA)

Venue

ACM Transactions on Applied Perception

Abstract

Los gráficos por ordenador tienen como objetivo ofrecer imágenes atractivas, generadas dentro de un presupuesto computacional, dirigidas a un dispositivo de visualización específico y, en última instancia, vistas por un usuario individual. La naturaleza foveal de la visión humana ofrece la oportunidad de asignar de manera eficiente el cálculo y la compresión a las áreas apropiadas del campo visual del espectador, lo cual reviste especial importancia con el auge de los dispositivos de visualización de alta resolución y amplio campo de visión. Sin embargo, aunque las variaciones en la agudeza y la sensibilidad al contraste a lo largo del campo de visión se han estudiado y modelado a fondo, existe una variación más relevante relacionada con la degradación de la visión periférica ante el desorden, conocida como «crowding». La comprensión del crowding periférico ha avanzado mucho en los últimos años, tanto en términos de fenomenología como de modelización. Aprovechar con precisión este conocimiento es fundamental para muchas aplicaciones, ya que la visión periférica abarca la mayor parte de los píxeles de la imagen. Desarrollamos modelos computacionales para la visión periférica con vistas a su uso final en gráficos por ordenador. En particular, los investigadores han desarrollado recientemente modelos de aglomeración periférica de alto rendimiento, conocidos como modelos de «pooling», que predicen una amplia gama de fenómenos pero son ineficientes desde el punto de vista computacional. Reformulamos el problema como un cálculo de flujo de datos, lo que permite un procesamiento más rápido y operar con imágenes de mayor tamaño. Además, tenemos en cuenta la codificación explícita de las características «end stopped» en la imagen, algo que faltaba en los métodos anteriores. Evaluamos nuestro modelo en el contexto de la percepción de texturas en la periferia, incluyendo un novedoso conjunto de datos de texturas y descriptores texturales actualizados. Nuestro marco computacional mejorado puede simplificar el desarrollo y la prueba de modelos más sofisticados y completos en entornos más robustos y realistas relevantes para los gráficos por ordenador.