De content op deze site is vertaald met behulp van kunstmatige intelligentie (AI) of machinevertalingstechnologie en kan fouten bevatten.

Skip to content
Human Computer Interaction
Computer Vision

Efficiënte dataflow-modellering van perifere codering in het menselijke visuele systeem

Author

Rachel Brown (NVIDIA), Vasha DuTell (Berkeley & NVIDIA), Ruth Rozenholtz (MIT), Bruce Walter (CMU), David Luebke (NVIDIA), Peter Shirley (NVIDIA), Morgan McGuire (NVIDIA)

Venue

ACM Transactions on Applied Perception

Abstract

Computergraphics streeft ernaar boeiende beelden te leveren, gegenereerd binnen een bepaald rekenbudget, gericht op een specifiek weergaveapparaat en uiteindelijk bekeken door een individuele gebruiker. De foveale aard van het menselijk gezichtsvermogen biedt de mogelijkheid om rekenkracht en compressie efficiënt toe te wijzen aan de juiste delen van het gezichtsveld van de kijker, wat van bijzonder belang is met de opkomst van weergaveapparaten met hoge resolutie en een breed gezichtsveld. Hoewel variaties in gezichtsscherpte en contrastgevoeligheid over het gezichtsveld heen goed zijn bestudeerd en gemodelleerd, is er een meer ingrijpende variatie die betrekking heeft op de verslechtering van het perifere zicht bij rommelige beelden, ook wel 'crowding' genoemd. Het inzicht in perifere crowding is de afgelopen jaren sterk toegenomen, zowel wat betreft fenomenologie als modellering. Het nauwkeurig benutten van deze kennis is cruciaal voor veel toepassingen, aangezien het perifere zicht het grootste deel van de pixels in het beeld beslaat. We ontwikkelen computationele modellen voor het perifere gezichtsvermogen met het oog op uiteindelijk gebruik in computergraphics. Onderzoekers hebben recentelijk met name hoogpresterende modellen van perifere crowding ontwikkeld, ook wel 'pooling'-modellen genoemd, die een breed scala aan fenomenen voorspellen maar computationeel inefficiënt zijn. We herformuleren het probleem als een dataflow-berekening, wat snellere verwerking en bewerking van grotere beelden mogelijk maakt. Verder houden we rekening met de expliciete codering van 'end stopped'-kenmerken in het beeld, wat ontbrak in eerdere methoden. We evalueren ons model in de context van de waarneming van texturen in de periferie, inclusief een nieuwe textuurdataset en bijgewerkte textuurdescriptoren. Ons verbeterde computationele raamwerk kan de ontwikkeling en het testen van meer geavanceerde, complete modellen vereenvoudigen in robuustere en realistischere omgevingen die relevant zijn voor computergraphics.