இந்த தளத்தின் உள்ளடக்கம் செயற்கை நுண்ணறிவு (AI) அல்லது இயந்திர மொழிபெயர்ப்பு தொழில்நுட்பம் மூலம் மொழிபெயர்க்கப்பட்டுள்ளது; பிழைகள் இருக்கலாம்.

Skip to content
Human Computer Interaction
Computer Vision

மனிதப் பார்வை அமைப்பில் புறக் குறியாக்கலின் திறமையான தரவுப்பாய்வு மாதிரியாக்கம்

Author

ரேச்சல் பிரவுன் (என்விடியா), வாஷா டுடெல் (பெர்க்லி & என்விடியா), ரூத் ரோசன்ஹோல்ட்ஸ் (எம்ஐடி), புரூஸ் வால்டர் (சிஎம்யு), டேவிட் லூப்கே (என்விடியா), பீட்டர் ஷர்லி (என்விடியா), மோர்கன் மெக்வைர் (என்விடியா)

Venue

ACM பயன்பாட்டு உணர்திறன் மீதான பரிவர்த்தனைகள்

Abstract

கணினி வரைகலை, ஒரு குறிப்பிட்ட காட்சி சாதனத்தை இலக்காகக் கொண்டு, ஒரு கணினி வரவு செலவுத் திட்டத்திற்குள் உருவாக்கப்பட்ட, ஈர்க்கக்கூடிய படங்களை வழங்க முயல்கிறது, இறுதியில் ஒரு தனிப்பட்ட பயனரால் பார்க்கப்படுகிறது. மனித பார்வையின் மையப் பார்வை இயல்பு, பார்வையாளரின் பார்வைப் புலத்தின் பொருத்தமான பகுதிகளுக்கு கணக்கீட்டு மற்றும் சுருக்கத்தை திறமையாக ஒதுக்க ஒரு வாய்ப்பை வழங்குகிறது, இது உயர்-தெளிவுத்திறன் மற்றும் பரந்த பார்வைப் புலம் கொண்ட காட்சி சாதனங்களின் வளர்ச்சியுடன் குறிப்பிட்ட முக்கியத்துவம் பெறுகிறது. இருப்பினும், பார்வைப் புலத்தில் கூர்மை மற்றும் மாறுபாட்டு உணர்திறனில் உள்ள மாறுபாடுகள் நன்கு ஆய்வு செய்யப்பட்டு மாதிரியாக்கப்பட்டிருந்தாலும், குழப்பமான சூழலில் புறப் பார்வையின் செயல்திறன் குறைவதைக் குறிக்கும் 'கிரௌடிங்' (crowding) எனப்படும் ஒரு மிக முக்கியமான மாறுபாடு உள்ளது. சமீபத்திய ஆண்டுகளில், புறப் பார்வைக் குழப்பத்தைப் பற்றிய புரிதல், நிகழ்வியல் மற்றும் மாதிரியாக்கம் ஆகிய இரண்டிலும் பெரிதும் முன்னேறியுள்ளது. படத்தின் பெரும்பாலான பிக்சல்களைப் புறப் பார்வை உள்ளடக்கியிருப்பதால், பல பயன்பாடுகளுக்கு இந்த அறிவைத் துல்லியமாகப் பயன்படுத்துவது மிகவும் முக்கியமானது. கணினி வரைகலையில் இறுதியில் பயன்படுத்துவதை நோக்கமாகக் கொண்டு, புறப் பார்வைக்கான கணக்கீட்டு மாதிரிகளை நாங்கள் முன்னிறுத்துகிறோம். குறிப்பாக, ஆராய்ச்சியாளர்கள் சமீபத்தில் "பூலிங்" மாதிரிகள் எனப்படும், உயர் செயல்திறன் கொண்ட புறப் பார்வை நெரிசல் மாதிரிகளை உருவாக்கியுள்ளனர். இவை பரந்த அளவிலான நிகழ்வுகளைக் கணித்தாலும், கணக்கீட்டு ரீதியாக திறமையானவை அல்ல. நாங்கள் இந்தச் சிக்கலை ஒரு தரவுப்பாய்வு கணக்கீடாக மறுவடிவமைக்கிறோம், இது பெரிய படங்களில் வேகமான செயலாக்கத்தையும் செயல்பாட்டையும் சாத்தியமாக்குகிறது. மேலும், முந்தைய முறைகளில் இல்லாத, படத்தில் உள்ள "எண்ட் ஸ்டாப்பட்" (end stopped) அம்சங்களின் வெளிப்படையான குறியாக்கத்தை நாங்கள் கணக்கில் எடுத்துக்கொள்கிறோம். புறப்பகுதியில் உள்ள இழைநயங்களை உணர்தல் என்ற பின்னணியில், ஒரு புதிய இழைநயத் தரவுத்தொகுப்பு மற்றும் புதுப்பிக்கப்பட்ட இழைநய விவரிப்பான்களை உள்ளடக்கிய எங்கள் மாதிரியை நாங்கள் மதிப்பீடு செய்கிறோம். கணினி வரைகலை தொடர்பான, மேலும் வலுவான மற்றும் யதார்த்தமான சூழல்களில், மிகவும் மேம்பட்ட, முழுமையான மாதிரிகளை உருவாக்குவதையும் சோதிப்பதையும் எங்கள் மேம்படுத்தப்பட்ட கணக்கீட்டு கட்டமைப்பு எளிதாக்கக்கூடும்.