Artificial Intelligence

SmoothCache: 확산 트랜스포머를 위한 범용 추론 가속 기술

Share

Author

Joseph Liu (Roblox), Joshua Geddes (퀸즈 대학교), Ziyu Guo (Roblox), Haomiao Jiang (Roblox), Mahesh Kumar Nandwana (Roblox)

Venue

CVPR eLVM 워크숍 2025

Abstract

확산 트랜스포머(DiT)는 이미지, 영상, 음성 합성을 포함한 다양한 작업에 강력한 생성 모델로 부상했습니다. 그러나 리소스 집약적인 어텐션 및 피드포워드 모듈을 반복적으로 평가해야 하기 때문에 여전히 추론 과정이 높은 연산 비용을 요구합니다. 이를 해결하기 위해, 본 연구에서는 DiT 아키텍처를 위한 모델 독립적 추론 가속 기술인 SmoothCache를 제안합니다. SmoothCache는 인접한 확산 시간 단계 간 레이어 출력 간의 높은 유사성을 활용합니다. SmoothCache는 소규모 보정 데이터셋을 통해 레이어별 표현 오차를 분석함으로써, 추론 과정에서 핵심 특징을 적응적으로 캐싱하고 재사용합니다. 실험 결과, SmoothCache는 다양한 모달리티에서 생성 품질을 유지하거나 심지어 향상시키면서도 8%에서 71%의 속도 향상을 달성하는 것으로 나타났습니다. 우리는 이미지 생성을 위한 DiT-XL, 텍스트-비디오 변환을 위한 Open-Sora, 텍스트-오디오 변환을 위한 Stable Audio Open에서 그 효과를 입증하며, 실시간 애플리케이션을 가능하게 하고 강력한 DiT 모델의 접근성을 확대할 수 있는 잠재력을 강조합니다.

함께 미래를 만들어 갑시다

모든 채용 정보 보기

최신

더 많은 결과

SmoothCache: 확산 트랜스포머를 위한 범용 추론 가속 기술

Author

Venue

Abstract

함께 미래를 만들어 갑시다

SmoothCache: 확산 트랜스포머를 위한 범용 추론 가속 기술

Author

Venue

Abstract

Related Publications

CubePart: 개방형 어휘를 지원하는 부품 제어형 3D 생성기

Grimlock: Guarding High-Agency Systems with eBPF and Attested Channels

카탈로그 기반 LLM: 추천을 위한 얽힘을 줄인 아이템 ID 방언 사용

함께 미래를 만들어 갑시다