Nội dung trên trang web này đã được dịch bằng trí tuệ nhân tạo (AI) hoặc công nghệ dịch máy và có thể có lỗi.

Skip to content
Human Computer Interaction
Computer Vision

Mô hình hóa luồng dữ liệu hiệu quả của quá trình mã hóa ngoại vi trong hệ thống thị giác của con người

Author

Rachel Brown (NVIDIA), Vasha DuTell (Berkeley & NVIDIA), Ruth Rozenholtz (MIT), Bruce Walter (CMU), David Luebke (NVIDIA), Peter Shirley (NVIDIA), Morgan McGuire (NVIDIA)

Venue

Tạp chí ACM về Nhận thức Ứng dụng

Abstract

Đồ họa máy tính nhằm mục đích tạo ra những hình ảnh hấp dẫn, được tạo ra trong phạm vi ngân sách tính toán, hướng đến một thiết bị hiển thị cụ thể và cuối cùng được người dùng cá nhân xem. Bản chất tập trung vào điểm trung tâm của thị giác con người mang lại cơ hội phân bổ hiệu quả việc tính toán và nén dữ liệu vào các khu vực thích hợp trong trường nhìn của người xem, điều này đặc biệt quan trọng với sự gia tăng của các thiết bị hiển thị có độ phân giải cao và trường nhìn rộng. Tuy nhiên, trong khi các biến thể về độ nhạy và độ tương phản trong trường nhìn đã được nghiên cứu và mô hình hóa kỹ lưỡng, một biến thể quan trọng hơn liên quan đến sự suy giảm của thị giác ngoại vi khi đối mặt với sự lộn xộn, được gọi là hiện tượng “crowding”. Hiểu biết về hiện tượng “crowding” ngoại vi đã có những tiến bộ đáng kể trong những năm gần đây, cả về mặt hiện tượng học lẫn mô hình hóa. Việc khai thác chính xác kiến thức này là rất quan trọng đối với nhiều ứng dụng, vì thị giác ngoại vi bao phủ phần lớn các pixel trong hình ảnh. Chúng tôi phát triển các mô hình tính toán cho thị giác ngoại vi nhằm mục đích ứng dụng trong đồ họa máy tính. Đặc biệt, các nhà nghiên cứu gần đây đã phát triển các mô hình hiệu suất cao về hiện tượng chen chúc ngoại vi, được gọi là "mô hình pooling", có khả năng dự đoán nhiều hiện tượng nhưng lại kém hiệu quả về mặt tính toán. Chúng tôi định hình lại vấn đề dưới dạng tính toán luồng dữ liệu, cho phép xử lý nhanh hơn và làm việc trên các hình ảnh có kích thước lớn hơn. Hơn nữa, chúng tôi tính đến việc mã hóa rõ ràng các đặc trưng “end stopped” trong hình ảnh, điều mà các phương pháp trước đây đã bỏ sót. Chúng tôi đánh giá mô hình của mình trong bối cảnh nhận thức về kết cấu ở vùng ngoại vi, bao gồm một bộ dữ liệu kết cấu mới và các mô tả kết cấu được cập nhật. Khung tính toán cải tiến của chúng tôi có thể đơn giản hóa việc phát triển và thử nghiệm các mô hình hoàn chỉnh, tinh vi hơn trong các thiết lập mạnh mẽ và thực tế hơn liên quan đến đồ họa máy tính.