Skip to content

Giới thiệu Kiến trúc lai Roblox: Phổ cập hóa trò chơi đa người chơi với đồ họa chân thực

Tầm nhìn của chúng tôi: Roblox Reality

Hôm nay, chúng tôi xin chia sẻ những thông tin kỹ thuật về một dự án nội bộ mang tên Roblox Reality, nhằm kết hợp trò chơi nhiều người chơi quy mô siêu lớn với đồ họa chân thực như ảnh. Chúng tôi tin rằng đây là một sự thay đổi cơ bản trong cách tạo ra và trải nghiệm các thế giới nhập vai nhiều người chơi. Sẽ có sẵn trong phiên bản đầu tiên vào cuối năm nay hoặc đầu năm sau, Roblox Reality là một kiến trúc lai kết hợp mô phỏng có cấu trúc của Game Engine phân tán với Video World Models dựa trên edge để thực hiện siêu lấy mẫu. Kiến trúc này sẽ giúp các nhà sáng tạo ở mọi quy mô có thể tạo ra và duy trì các thế giới tương tác kết hợp độ trung thực hình ảnh và chuyển động chưa từng có trên nền tảng tính bền vững và cấu trúc truyền thống, mà không làm tăng chi phí phát triển.

Roblox Reality là kiến trúc lai kết hợp khả năng của Roblox Cloud và Game Engine với độ chân thực hình ảnh của Video World Models. Trạng thái cốt lõi của thế giới được lưu trữ bền vững và hiệu quả trên máy chủ để đảm bảo tính nhất quán giữa các client và duy trì tính nhất quán theo thời gian, phiên chơi và ngày tháng thông qua hệ thống lưu trữ tiết kiệm chi phí và dung lượng. Chế độ chơi đa người chơi được hỗ trợ thông qua quyền kiểm soát mạnh mẽ từ máy chủ để đảm bảo công bằng và nhất quán, kết hợp với mô phỏng dự đoán phía client để đạt độ trễ thấp. Đối với việc hiển thị, hệ thống mức độ chi tiết (LOD) và ghép hình dựa trên đám mây tạo ra các tài sản độ chi tiết cao được phân phối qua mạng phân phối nội dung (CDN). Mô hình Video Roblox (Super Upsampler) tận dụng video đã hiển thị và bối cảnh mô hình dữ liệu phong phú để tạo ra hình ảnh ngẫu nhiên và độ chân thực ấn tượng, hoạt động tại biên cho mỗi người chơi với hiệu suất tối ưu nhờ hạ tầng GPU đám mây-biên. Khách hàng Roblox phong phú sau đó sẽ hiển thị luồng video này và, trong tương lai, tùy chọn chồng lớp avatar được hiển thị cục bộ đã được nâng cấp độ phân giải để duy trì độ trễ rất thấp cho các hành động ở foreground.

Trong các bản demo dưới đây, chúng tôi trình bày bốn video của các trò chơi khác nhau. Video ở góc trên bên trái là nội dung Roblox được ghi lại bằng công cụ render Roblox hiện tại, video ở góc trên bên phải là biểu diễn dữ liệu 3D mà chúng tôi có thể sử dụng để điều kiện hóa quá trình tạo video. Video ở góc dưới bên trái cho thấy mô hình video nâng cấp độ phân giải hiện tại của Roblox đang chạy trong phòng thí nghiệm của chúng tôi, mô hình này hiện chưa chạy thời gian thực, còn video ở góc dưới bên phải cho thấy bản mô phỏng tầm nhìn sản phẩm của chúng tôi và những gì có thể thực hiện được trong tương lai với công nghệ này.

Mô hình thế giới video: Ưu điểm và hạn chế

Mô hình thế giới video rất xuất sắc trong việc tạo ra các hành vi hợp lý, đa chiều mà không cần phải mô phỏng rõ ràng từng tương tác riêng lẻ.

Việc vận hành các mô hình thế giới video trong không gian tiềm ẩn video gặp phải những hạn chế kỹ thuật cụ thể: Quá trình này hiện tốn kém về mặt chi phí, và việc đạt được hiệu suất thời gian thực với độ trung thực cao, chẳng hạn như độ phân giải 2K ở 60 Hz, vẫn là một thách thức trong phát triển. Điều quan trọng là, với trạng thái thế giới được biểu diễn trong không gian video, các mô hình này hiện tại không hỗ trợ chế độ đa người chơi. Một hạn chế chính là sự cân bằng giữa độ chính xác của mô phỏng và tính hợp lý về mặt hình ảnh: Việc chỉ nhìn thấy 500 người di chuyển trong video không có nghĩa là họ là các tác nhân cá nhân hóa hoặc "avatar có trí tuệ". Không dự kiến rằng quy mô mô hình video hiện tại sẽ tự nhiên hỗ trợ mô phỏng tác nhân phức tạp, cá nhân hóa cần thiết cho trải nghiệm đa người chơi thực sự.

Khả năng này là thiết yếu khi quản lý một đám đông sống động gồm 20.000 người phản ứng theo thời gian thực. Tuy nhiên, một Mô hình Thế giới Video đơn lẻ không thể quản lý đáng tin cậy các tương tác giữa nhiều người chơi trong một phiên kéo dài hai giờ. Mô hình thế giới gặp khó khăn trong việc thực thi quy tắc nghiêm ngặt và duy trì trạng thái liên tục do thiếu bộ nhớ dài hạn và logic nhất quán. Mô hình Thế giới Video thiếu dữ liệu điều khiển đầu vào của người dùng, đó là lý do tại sao chơi mô hình Thế giới Video không thú vị. Vì mô hình Thế giới Video gặp khó khăn với trạng thái liên tục, logic nhất quán, điều khiển đầu vào của người dùng và mô phỏng tác nhân đa người chơi thực sự, các mô hình hiện tại giống như những giấc mơ được hướng dẫn.

Các mô hình video tương tác mà chúng ta thấy ngày nay rất ấn tượng, nhưng về cơ bản chỉ là những giấc mơ sống động — ngoạn mục khi nhìn vào, nhưng thoáng qua và vô cùng cô đơn. Chúng thiếu tính tương tác, thách thức, phần thưởng và tính bền vững — bất cứ điều gì làm nên một trò chơi. 

Các mô hình thế giới thần kinh thuần túy không thể thực hiện được lời hứa về một trải nghiệm đa người chơi rộng lớn và bền vững. Mặc dù các mô hình thế giới thần kinh ấn tượng ở nhiều khía cạnh, chúng lại thất bại ở nhiều lĩnh vực quan trọng. Một số trong số đó bao gồm tính nhất quán theo thời gian trong một phiên chơi, trí nhớ dài hạn giữa các phiên, độ trễ và khả năng kiểm soát chi tiết của người tạo. Những khoảng trống ít rõ ràng hơn xuất hiện khi nghĩ đến mô phỏng đa người chơi nhất quán, lối chơi cạnh tranh khắt khe, NPC thông minh cao, kiểm thử và tinh chỉnh dần dần.

Chúng ta không nên yêu cầu một công cụ thần kinh trở thành một công cụ trò chơi. 

Công cụ trò chơi: Điểm mạnh và hạn chế

Roblox Cloud và Engine bổ sung mạnh mẽ cho các mô hình thế giới video. Với độ chính xác có thể tái tạo, trạng thái nhất quán giữa các phiên và tính bền vững theo thời gian. Ví dụ, một nhà sáng tạo đang xây dựng trò chơi Grand Prix Monaco Formula 1. Họ đang mô phỏng các hệ thống tính điểm và phạt chính xác, đường đua, đám đông, thiên nhiên và đồng bộ hóa tức thì giữa nhiều tay đua. Tuy nhiên, độ chính xác này đi kèm với chi phí triển khai và thời gian chạy. Việc tăng cường độ chân thực về mặt hình ảnh đòi hỏi tài nguyên nặng, ánh sáng phức tạp và mô phỏng.

Trong thập kỷ tới, các sản phẩm của các công cụ trò chơi cao cấp sẽ tiếp tục tiến bộ về độ chân thực, nhưng các yêu cầu về trình độ chuyên môn của nhà phát triển và phần cứng của người tiêu dùng cũng sẽ tăng theo. 

Thách thức mà ngành công nghiệp này chưa thể giải quyết cho đến nay là làm thế nào để mang lại sự siêu thực trên quy mô lớn, đồng thời giúp các nhà phát triển lớn nhỏ có thể tiếp cận được và trên phần cứng tiêu dùng phổ biến.

Điều này là do thế giới thực có chi tiết tinh tế. Xung quanh lõi trò chơi là mọi thứ khác — các yếu tố tự nhiên, không được lập trình sẵn như những ngọn cỏ, lá cây và cành cây lay động nhẹ nhàng trong gió, những đám bụi cuộn xoáy phía sau xe, những tàn lửa và tia lửa bắn ra từ ngọn lửa, và những giọt mưa nhẹ nhàng văng tung tóe trên vũng nước dầu lấp lánh. Nội dung này rất khó để tạo ra và hiển thị. Các engine game truyền thống gặp khó khăn với độ phức tạp thị giác này, tìm cách cắt giảm để đạt được sự chân thực đơn giản hơn, vì chi phí bộ nhớ cho các texture và hình học độ phân giải cao gây áp lực lên tài nguyên sẵn có. Chi phí mô phỏng cũng tăng vọt lên mức phi lý với ánh sáng thể tích, âm thanh binaural, vật lý và mô phỏng nhân vật — những yếu tố cùng tạo nên sự chân thực như ảnh.

Chúng tôi tin rằng cách tốt nhất để các nhà sáng tạo xây dựng và các công cụ hiển thị sự phức tạp này là tận dụng kiến trúc lai, trong đó Mô hình Thế giới Video được huấn luyện sau sẽ tạo ra kết cấu, ánh sáng và động lực học quy mô nhỏ dựa trên chuyển động camera, hình học và trạng thái bối cảnh cơ bản của công cụ.

Kiến trúc: Đồng bộ hóa logic trò chơi và pixel video

Chúng tôi tin rằng cần có một phương pháp kết hợp để cho phép các nhà sáng tạo cung cấp tương tác nhiều người chơi có độ trung thực cao với kết quả đầu ra chân thực như ảnh. Chúng tôi gọi phương pháp này là Roblox Reality, kết hợp giữa Roblox Game Engine, Roblox Cloud và Mô hình thế giới video Roblox Super Upsampler.

Kiến trúc kết hợp Roblox Reality phân chia trách nhiệm giữa Roblox Game Engine và Mô hình thế giới video Roblox. 

Roblox Game Engine xử lý các khía cạnh có cấu trúc và logic của thế giới, cung cấp bộ nhớ dài hạn ổn định, logic biểu tượng và mô phỏng có thể lặp lại. Nó cũng chịu trách nhiệm về các hoạt động vật lý cơ bản như va chạm và hành vi. Chuyển động chính của các đối tượng được quản lý trong engine, ví dụ như vị trí và vận tốc của một chiếc xe, bánh xe, hệ thống giảm xóc và hệ thống lái. Dựa trên nền tảng này, Mô hình Thế giới Video bổ sung các thành phần hình ảnh và tạo hình bổ sung, như những giọt nước chảy dọc theo kính chắn gió và những chiếc lá bay phấp phới khi chiếc xe lao qua, mang đến những hình ảnh ngoạn mục. Cách tiếp cận này cho phép Game Engine duy trì mô hình dữ liệu (trạng thái được chia sẻ và nhất quán) trong khi Mô hình Thế giới Video tạo ra các Pixel (giấc mơ hình ảnh).

Tính năng

Công cụ trò chơi
(Roblox Cloud)

Super Upsampler
(Mô hình video Roblox)

Chức năng chính

Quản lý tất cả quá trình đồng bộ hóa trạng thái để duy trì tính nhất quán của thế giới (mô hình dữ liệu, trạng thái chung và nhất quán).

Quản lý các thành phần trực quan và tạo hình (Pixels, giấc mơ trực quan).

Trách nhiệm chính

Cung cấp bộ nhớ dài hạn ổn định, logic biểu tượng và mô phỏng có thể lặp lại. Chịu trách nhiệm về các thuộc tính vật lý cơ bản (vật liệu và vị trí) và các hoạt động (va chạm và dò tia).

Cung cấp hình ảnh ngẫu nhiên và độ chân thực ngoạn mục, chuyển động thứ cấp, môi trường động tự nhiên và vật lý chất lỏng. Tạo ra kết cấu có độ trung thực cao hơn, ánh sáng thực tế hơn và động lực học ở quy mô nhỏ.

Tính nhất quán của thế giới

Cung cấp độ chính xác, trạng thái nhất quán và đảm bảo tính nhất quán. Tập trung trạng thái vào một nguồn thông tin duy nhất.

Vượt trội trong việc tạo ra các hành vi hợp lý, đa chiều mà không cần mô phỏng rõ ràng (ví dụ: quản lý đám đông sống động). Hoạt động ở mức tối đa cho mọi người chơi.

Dữ liệu được xử lý

Mọi thứ nhất quán giữa tất cả người chơi (người chơi, vị trí, ô tô, chim, tòa nhà, cảnh 3D).

Những thứ thoáng qua mà người chơi không cần phải nhìn thấy chính xác như nhau (lon rỉ sét, đàn chim, hình dạng đám mây, hạt cát, cỏ).

Bộ nhớ

Mô hình dữ liệu

Dữ liệu tiềm ẩn video

Hạn chế độc lập

Gặp khó khăn với độ phức tạp về mặt hình ảnh và yêu cầu tính toán cao để đạt được độ chân thực như ảnh.

Gặp khó khăn với việc thực thi quy tắc nghiêm ngặt, bộ nhớ dài hạn, logic nhất quán và dữ liệu kiểm soát đầu vào của người dùng.

Hạ tầng thời gian chạy

Hơn 26 trung tâm dữ liệu biên trên toàn thế giới, chạy hàng triệu phiên bản trò chơi, gần người dùng để đảm bảo độ trễ thấp, đạt đỉnh điểm với hơn 45 triệu người dùng đồng thời.

Super Upsampler chạy trong các trung tâm dữ liệu biên liền kề, mang lại hiệu suất tối ưu, được hỗ trợ bởi GPU lớp H200/B200 (hoặc bộ tăng tốc tương đương) 

Cùng nhau, nền tảng này hỗ trợ việc tạo nội dung vô hạn với quyền kiểm soát sâu rộng cho người sáng tạo.

Các mục tiêu phát triển của chúng tôi đối với Roblox Reality bao gồm việc tạo ra một Mô hình Video Roblox có khả năng cung cấp độ phân giải 2K ở tần số 60 Hz bằng cách lấy dữ liệu gốc từ Roblox Game Engine: bao gồm cả video đã được hiển thị và dữ liệu không gian 3D. Roblox Reality sẽ được tối ưu hóa để chạy trên cơ sở hạ tầng GPU tại rìa đám mây kết hợp với truyền phát video, đồng thời cuối cùng sẽ tích hợp với ứng dụng khách Roblox để hỗ trợ điều khiển và mô phỏng avatar cục bộ.

Tóm tắt

Roblox Reality đánh dấu một bước tiến quan trọng trong việc dân chủ hóa quá trình sáng tạo, cho phép bất kỳ nhà sáng tạo nào cũng có thể xây dựng các trò chơi có đồ họa chân thực bằng cách tận dụng Roblox Game Engine và Mô hình Video, từ đó giảm đáng kể thời gian, chi phí và tài nguyên tính toán vốn thường được yêu cầu cho đồ họa chất lượng cao. Điều này giúp việc tạo ra các trò chơi có đồ họa chân thực trở nên nhanh chóng hơn và tiết kiệm chi phí cũng như tài nguyên tính toán hơn cho các nhà sáng tạo của chúng tôi. Do chi phí tính toán cao, chúng tôi nhận thức được những thách thức cần giải quyết trước khi có thể mở rộng kiến trúc Roblox Reality. Chúng tôi đang nghiên cứu các giải pháp để tối ưu hóa và nâng cao hiệu quả cho kiến trúc này, nhằm có thể mở rộng quy mô một cách tiết kiệm chi phí cho hàng triệu người chơi đồng thời.

Trên hết, chúng tôi rất hào hứng khi xây dựng một nền tảng để mở ra những trò chơi cho phép các nhà sáng tạo của chúng tôi tạo ra những trải nghiệm đa người chơi chân thực tuyệt vời!