Artificial Intelligence

SmoothCache: Teknik Akselerasi Inferensi Universal untuk Transformer Difusi

Share

Author

Joseph Liu (Roblox), Joshua Geddes (Queen's University), Ziyu Guo (Roblox), Haomiao Jiang (Roblox), Mahesh Kumar Nandwana (Roblox)

Venue

Lokakarya CVPR eLVM 2025

Abstract

Diffusion Transformers (DiT) telah muncul sebagai model generatif yang kuat untuk berbagai tugas, termasuk sintesis gambar, video, dan ucapan. Namun, proses inferensinya tetap memakan banyak sumber daya komputasi karena evaluasi berulang dari modul perhatian dan feed-forward yang intensif sumber daya. Untuk mengatasi hal ini, kami memperkenalkan SmoothCache, sebuah teknik percepatan inferensi yang tidak bergantung pada model untuk arsitektur DiT. SmoothCache memanfaatkan kesamaan tinggi yang diamati antara keluaran lapisan di seluruh langkah waktu difusi yang berdekatan. Dengan menganalisis kesalahan representasi per lapisan dari kumpulan kalibrasi kecil, SmoothCache secara adaptif menyimpan dan menggunakan kembali fitur-fitur kunci selama inferensi. Eksperimen kami menunjukkan bahwa SmoothCache mencapai percepatan 8% hingga 71% sambil mempertahankan atau bahkan meningkatkan kualitas generasi di berbagai modalitas. Kami menunjukkan keefektifannya pada DiT-XL untuk generasi gambar, Open-Sora untuk teks-ke-video, dan Stable Audio Open untuk teks-ke-audio, menyoroti potensinya untuk memungkinkan aplikasi waktu nyata dan memperluas aksesibilitas model DiT yang kuat.

Bergabunglah bersama kami dalam membentuk masa depan

Lihat Semua Pekerjaan

Terbaru

Lebih banyak hasil

SmoothCache: Teknik Akselerasi Inferensi Universal untuk Transformer Difusi

Author

Venue

Abstract

Bergabunglah bersama kami dalam membentuk masa depan

SmoothCache: Teknik Akselerasi Inferensi Universal untuk Transformer Difusi

Author

Venue

Abstract

Related Publications

CubePart: Generator 3D dengan Kosakata Terbuka dan Komponen yang Dapat Dikendalikan

Grimlock: Guarding High-Agency Systems with eBPF and Attested Channels

LLM Asli Katalog: Menggunakan Dialek ID Item dengan Keterikatan yang Lebih Sedikit untuk Rekomendasi

Bergabunglah bersama kami dalam membentuk masa depan