Arboretum: un pianificatore per analisi federate su larga scala con privacy differenziale
Author
Venue
SOSP 2023
Abstract
L'analisi federata è un modo per rispondere a query su dati sensibili distribuiti tra più parti, senza condividere i dati o raccoglierli in un unico luogo. Lavori precedenti hanno sviluppato soluzioni in grado di scalare fino a grandi implementazioni con milioni di dispositivi ma, a causa della natura distribuita dell'analisi federata, queste soluzioni possono supportare solo una classe limitata di query - tipicamente varie forme di query numeriche, a cui è possibile rispondere con primitive crittografiche leggere. Supportare query più complesse, come quelle categoriali, richiede una crittografia più pesante, il cui costo può superare rapidamente anche le risorse di un potente data center. In questo articolo presentiamo Arboretum, un nuovo sistema di analisi federata in grado di rispondere in modo efficiente a una gamma più ampia di query, comprese quelle categoriali, in implementazioni con milioni o addirittura miliardi di partecipanti. Arboretum raggiunge questo obiettivo 1) ottimizzando automaticamente i piani di query per trovare modi altamente efficienti per rispondere a ciascuna query e 2) includendo i dispositivi dei partecipanti nel calcolo. La nostra valutazione mostra che Arboretum può eguagliare il costo dei sistemi precedenti che sono stati ottimizzati manualmente per particolari tipi di query e che può inoltre supportare una gamma di nuove query per le quali oggi non esiste una soluzione efficiente.
