Vài tháng trước, Nvidia đã đưa ra một tuyên bố táo bạo, gây nhiều tranh cãi trong cộng đồng game thủ và các chuyên gia công nghệ: DLSS 4 cùng mô hình AI Transformer mới của họ có thể mang lại chất lượng hình ảnh vượt trội hơn cả độ phân giải gốc (native resolution). Tuyên bố này xuất hiện trong bối cảnh ra mắt dòng card RTX 5060 và nhanh chóng trở thành một chủ đề nóng hổi trong hệ sinh thái game PC. Nhiều người tin rằng, đôi khi việc bật DLSS không chỉ giúp tăng hiệu suất mà còn cải thiện đáng kể chất lượng hình ảnh, khiến game trông đẹp hơn so với khi chạy ở độ phân giải gốc, ngay cả khi bạn không cần nâng cao hiệu năng.
Thoạt nghe, điều này có vẻ như là một chiến lược marketing phóng đại, đánh lừa nhận thức của người dùng về “sự thật” của hình ảnh. Tuy nhiên, đằng sau tuyên bố tưởng chừng phi lý này lại ẩn chứa những cơ sở khoa học và công nghệ vững chắc. Mặc dù ý tưởng rằng một công nghệ nâng cấp hình ảnh (upscaling) có thể tạo ra hình ảnh đẹp hơn độ phân giải gốc nghe có vẻ đi ngược lại trực giác, nhưng thực tế nó lại rất hợp lý với các tựa game hiện đại. Đặc biệt, với mô hình AI Transformer cải tiến trong DLSS 4, bạn sẽ dễ dàng nhận thấy những trò chơi mà việc chạy ở độ phân giải thấp hơn (được xử lý bởi DLSS) lại cho ra hình ảnh đẹp hơn hẳn so với việc chạy ở độ phân giải cao hơn theo cách truyền thống.
Định Nghĩa Lại “Độ Phân Giải Gốc” (Native Resolution)
Không chỉ đơn thuần là render mọi pixel
Phần lớn sự nhầm lẫn xung quanh ý tưởng DLSS trông đẹp hơn độ phân giải gốc xuất phát từ việc hiểu sai về “native resolution” là gì. Ở cấp độ cơ bản, độ phân giải gốc có nghĩa là GPU của bạn đang render mọi pixel trên màn hình. Người ta thường cho rằng không thể có công cụ upscaling nào (như DLSS) có thể đánh bại độ phân giải gốc, bởi lẽ các công cụ này không render mọi pixel mà chỉ xử lý một tập hợp nhỏ các pixel, sau đó sử dụng mô hình AI để nội suy và tạo ra phần còn lại.
Tuy nhiên, việc GPU render mọi pixel không có nghĩa là bạn nhìn thấy trực tiếp “nguyên bản” đầu ra pixel trên màn hình. Trên thực tế, với các trò chơi hiện đại, điều này gần như không bao giờ xảy ra. Bất cứ khi nào một đường chéo cắt qua các pixel vuông, bạn sẽ thấy những cạnh răng cưa khó chịu, và khi những cạnh đó chuyển động, chúng sẽ bị nhấp nháy, rung lắc. Độ phân giải gốc theo nghĩa “thô” thường để lộ những khuyết điểm này, và đầu ra pixel không qua xử lý sẽ không trông đẹp mắt. Hầu hết các trò chơi không xử lý “độ phân giải gốc” theo cách này. Thay vào đó, chúng sử dụng một dạng công nghệ khử răng cưa (anti-aliasing) nào đó để làm mịn các cạnh thô, ngay cả khi bạn không có tùy chọn khử răng cưa trong menu đồ họa.
Chúng ta không thực sự so sánh “độ phân giải gốc” (raw pixel output) với DLSS. Thay vào đó, chúng ta đang so sánh DLSS với việc render mọi pixel và sử dụng các thuật toán khử răng cưa giá rẻ để làm sạch hình ảnh.
Ngày nay, các trò chơi chủ yếu sử dụng các hình thức khử răng cưa giá rẻ, tức là các thuật toán có tác động không đáng kể đến hiệu suất. Phần lớn, các trò chơi sử dụng TAA (Temporal Anti-Aliasing), nhưng đôi khi bạn cũng sẽ thấy FXAA (Fast Approximate Anti-Aliasing). Các hình thức khử răng cưa đòi hỏi nhiều tài nguyên hơn như MSAA (Multisample Anti-Aliasing) và SSAA (Supersample Anti-Aliasing) hiếm khi xuất hiện trong các trò chơi hiện đại.
Khi xem xét các trò chơi sử dụng DLSS 4, chúng ta không so sánh “độ phân giải gốc” ở trạng thái thô (chưa qua khử răng cưa) với DLSS. DLSS và bất kỳ hình thức khử răng cưa nào khác đều sẽ chiến thắng trong cuộc chiến đó. Chúng ta đang so sánh DLSS với việc render mọi pixel và sử dụng các công nghệ khử răng cưa giá rẻ để làm sạch hình ảnh. Để minh chứng cho luận điểm này, hãy xem ví dụ về Marvel Rivals.
So sánh chất lượng hình ảnh trong game Marvel Rivals giữa độ phân giải gốc và DLSS 4 Performance
Hình ảnh trên chưa được dán nhãn. Một trong hai hình ảnh là Marvel Rivals chạy ở độ phân giải gốc, hình còn lại sử dụng DLSS ở chế độ Performance, nghĩa là chỉ một phần tư số pixel hiển thị thực sự được render. Bạn có thể tự mình đánh giá hình ảnh nào trông đẹp hơn. Nếu chơi Marvel Rivals ở độ phân giải gốc không qua xử lý (true native resolution), bạn sẽ không nhận được trải nghiệm tốt nhất; thay vào đó, bạn sẽ chơi với TAA hoặc một công nghệ khử răng cưa tương tự. Và thực tế, DLSS 4 với mô hình Transformer thường cho hình ảnh đẹp hơn hầu hết các triển khai TAA.
DLSS Phơi Bày Chi Tiết, Không Phải Tạo Ra Chi Tiết Mới
Vai trò của mô hình AI Transformer trong DLSS 4
Nvidia thường sử dụng ví dụ về tựa game Avowed khi nói về DLSS 4 và cách nó cải thiện hình ảnh vượt trội so với độ phân giải gốc. Hãy nhìn vào những chi tiết phức tạp trên cuốn sách phép thuật trong hình ảnh dưới đây. Với DLSS 4, chúng trông sắc nét hơn nhiều so với khi chạy ở độ phân giải gốc. DLSS 4 không tự “phát minh” ra các chi tiết mới để đưa vào kết cấu trải rộng trên trang sách, hoặc ít nhất, nó không áp dụng một lớp làm sắc nét quá mức trên toàn bộ hình ảnh. Trong trường hợp này, DLSS 4 đã “phơi bày” những chi tiết tinh xảo của kết cấu mà cách render gốc (kết hợp với khử răng cưa) đã làm mịn và che lấp.
Chi tiết hình ảnh trong game Avowed sắc nét hơn với công nghệ DLSS 4 so với độ phân giải gốc
Điều này càng trở nên hợp lý hơn nếu bạn biết về Avowed. Trò chơi này được xây dựng bằng Unreal Engine 5, một engine được thiết kế xoay quanh TAA. Về mặt kỹ thuật, bạn có thể sử dụng MSAA trong UE5, nhưng bạn sẽ phải đánh đổi Lumen và Nanite với forward renderer. Dù sao đi nữa, UE5 sử dụng TAA, và việc tắt TAA sẽ tạo ra một hình ảnh khá tệ — tương tự như Marvel Rivals ở phần trên, cũng được xây dựng trên UE5. DLSS với mô hình Transformer của nó có khả năng “phơi bày” những chi tiết mà TAA đã làm mờ hoặc bỏ qua.
Mô hình Transformer có thể làm được điều này nhờ cơ chế tự chú ý (self-attention mechanism) bên trong loại mô hình này. Không đi quá sâu vào chi tiết kỹ thuật học sâu, một mô hình Transformer đòi hỏi nhiều tài nguyên tính toán hơn so với CNN (Convolutional Neural Network), nhưng nó cũng xem xét một phạm vi ngữ cảnh rộng hơn. Với CNN, bạn có thể nhận được một hình ảnh trông giống như độ phân giải gốc – tức là mọi pixel được render và làm mịn bằng TAA – nhưng với mô hình Transformer, bạn có thể đẩy chất lượng hình ảnh vượt ra ngoài độ phân giải gốc. Transformer có khả năng tiếp nhận tất cả các pixel cùng một lúc, hiểu chúng và tái tạo lại hình ảnh với ngữ cảnh của toàn bộ khung cảnh.
Đánh Giá Bằng Hình Ảnh Cuối Cùng
Khi nói về các công nghệ như DLSS, DLDSR hay FSR, thường có những ý kiến trái chiều, đặc biệt là khi ai đó cho rằng “DLSS trông đẹp hơn độ phân giải gốc” là một điều vô lý. Ở một mức độ nào đó, điều đó đúng. Việc render mọi pixel sẽ mang lại nhiều chi tiết hơn so với việc nội suy một phần pixel, đây là lý do lớn tại sao các công cụ như DLSS hoạt động tốt hơn nhiều ở độ phân giải cao hơn, nơi có nhiều dữ liệu đầu vào hơn. Tuy nhiên, như chúng ta đã phân tích, “độ phân giải gốc” không chỉ đơn thuần là việc render tất cả các pixel. Khi chúng ta nói về độ phân giải gốc, chúng ta đang nói về hình ảnh cuối cùng mà bạn nhìn thấy, bao gồm cả quá trình xử lý hậu kỳ sau khi các pixel đã được render.
Và, như bạn có thể thấy từ các ví dụ hình ảnh đã chia sẻ, DLSS 4 với mô hình Transformer thực sự trông đẹp hơn độ phân giải gốc, ít nhất là trong các trò chơi hiện đại hơn, vốn phụ thuộc nhiều vào TAA. Điều này không đúng với mọi trò chơi. Ví dụ, một trò chơi như Forza Horizon 5 có tích hợp MSAA, và cuộc đối đầu giữa nó và DLSS 4 sẽ cân bằng hơn nhiều. Bạn thực sự không cần phải đào sâu vào engine hoặc hiểu rõ các tính năng đồ họa đang diễn ra “sau cánh gà” mà bạn không thể truy cập. Bạn chỉ cần nhìn vào hình ảnh cuối cùng.
Luôn có nhiều cách khác nhau mà các nhà phát triển sử dụng để làm mịn các cạnh răng cưa của quá trình render, và DLSS Super Resolution là công cụ mới nhất đã trở nên phổ biến.
Tôi biết điều này nghe có vẻ hiển nhiên, nhưng phần lớn các cuộc thảo luận xung quanh DLSS (và các công cụ upscaling/tạo khung hình khác) thường xoay quanh việc một hình ảnh khách quan tốt hơn hình ảnh kia. Và thông thường, quan điểm đó nghiêng về phía độ phân giải gốc, bị ảnh hưởng bởi việc GPU phải thực hiện tất cả công việc nặng nhọc là thực sự render tất cả các pixel. Cuộc thảo luận không tập trung vào hình ảnh đầy đủ của một trò chơi mà bạn đang chơi, mà thay vào đó, nó tập trung vào các chi tiết nhỏ để tìm ra sự khác biệt, và coi độ phân giải gốc là một “chân lý khách quan” mà mọi phương pháp render khác phải được đo lường.
Trên thực tế, luôn có nhiều cách khác nhau mà các nhà phát triển sử dụng để làm mịn các cạnh răng cưa của quá trình render, và DLSS Super Resolution là công cụ mới nhất đã trở nên phổ biến. Nhiều năm trước, bạn sẽ phải thực hiện cách khó hơn với SSAA, nhưng sau đó MSAA đã mang lại hiệu suất tốt hơn nhiều dù chất lượng có giảm. FXAA sau đó trở nên phổ biến như một giải pháp thay thế cực kỳ rẻ tiền nhưng trông tệ hại, và sau đó ngành công nghiệp chuyển hướng sang TAA, mang lại hiệu suất vượt trội và chất lượng hình ảnh tuyệt vời, mặc dù có một số hiện tượng nhiễu hình ảnh.
DLSS đã củng cố vị thế của mình như một trong những tính năng đồ họa quan trọng nhất có sẵn trên PC, và điều đó sẽ không thay đổi. Nếu bạn không thích cách nó hiển thị, hoặc bạn nghĩ rằng render “gốc” tốt hơn, thì điều đó hoàn toàn ổn. Nhưng với những người khác, hãy nhìn vào hình ảnh cuối cùng bạn nhận được. Đặc biệt trong các trò chơi gần đây, vốn rất phụ thuộc vào TAA, mô hình Transformer của DLSS thường sẽ vượt trội.
Nếu bạn còn băn khoăn về hiệu quả của DLSS 4, hãy trải nghiệm trực tiếp hoặc tìm kiếm các video so sánh chi tiết. Đừng quên chia sẻ nhận định của bạn về công nghệ này trong phần bình luận bên dưới nhé!