Systems
Arboretum: 차등 프라이버시를 지원하는 대규모 연합 분석용 플래너
Author
Venue
SOSP 2023
Abstract
연합 분석(Federated analytics)은 데이터를 공유하거나 단일 장소에 수집하지 않고도 여러 당사자에 분산된 민감한 데이터에 대한 쿼리에 응답하는 방법입니다. 기존 연구에서는 수백만 대의 장치를 포함하는 대규모 배포 환경까지 확장 가능한 솔루션을 개발해 왔으나, 연합 분석의 분산된 특성상 이러한 솔루션은 경량 암호화 원시 연산으로 처리 가능한 다양한 형태의 수치 쿼리와 같은 제한된 종류의 쿼리만 지원할 수 있습니다. 범주형 쿼리와 같은 더 풍부한 쿼리를 지원하려면 더 복잡한 암호화가 필요하며, 이에 따른 비용은 강력한 데이터 센터의 자원조차 금세 초과할 수 있습니다. 본 논문에서는 수백만 또는 수십억 명의 참여자가 있는 환경에서도 범주형 쿼리를 포함한 더 광범위한 쿼리에 효율적으로 응답할 수 있는 새로운 연합 분석 시스템인 'Arboretum'을 제시합니다. Arboretum은 1) 각 쿼리에 대한 매우 효율적인 처리 방식을 찾기 위해 쿼리 실행 계획을 자동으로 최적화하고, 2) 계산 과정에 참여자 기기를 포함시킴으로써 이를 달성합니다. 평가 결과, Arboretum은 특정 유형의 쿼리에 대해 수동으로 최적화된 기존 시스템과 동등한 처리 비용을 보이며, 현재 효율적인 해결책이 존재하지 않는 다양한 새로운 쿼리까지 추가로 지원할 수 있음이 입증되었습니다.
