Le contenu de ce site a été traduit à l'aide de l'intelligence artificielle (IA) ou d'une technologie de traduction automatique, et peut contenir des erreurs.

Skip to content
Systems

Arboretum : un planificateur pour l'analyse fédérée à grande échelle avec confidentialité différentielle

View Publication

Author

Elizabeth Margolin (Université de Pennsylvanie), Karan Newatia (Université de Pennsylvanie), Tao Luo (Université de Pennsylvanie), Edo Roth (Université de Pennsylvanie), Andreas Haeberlen (Université de Pennsylvanie / Roblox)

Venue

SOSP 2023

Abstract

L'analyse fédérée est un moyen de répondre à des requêtes portant sur des données sensibles réparties entre plusieurs parties, sans partager ces données ni les rassembler en un seul endroit. Des travaux antérieurs ont permis de développer des solutions pouvant s'adapter à de grands déploiements comprenant des millions d'appareils, mais, en raison de la nature distribuée de l'analyse fédérée, ces solutions ne peuvent prendre en charge qu'une catégorie limitée de requêtes — généralement diverses formes de requêtes numériques, auxquelles il est possible de répondre à l'aide de primitives cryptographiques légères. Prendre en charge des requêtes plus riches, telles que les requêtes catégorielles, nécessite une cryptographie plus lourde, dont le coût peut rapidement dépasser même les ressources d'un centre de données puissant. Dans cet article, nous présentons Arboretum, un nouveau système d'analyse fédérée capable de répondre efficacement à un éventail plus large de requêtes, y compris les requêtes catégorielles, dans des déploiements comptant des millions, voire des milliards de participants. Arboretum y parvient 1) en optimisant automatiquement les plans de requête afin de trouver des moyens hautement efficaces de répondre à chaque requête, et 2) en incluant les appareils des participants dans le calcul. Notre évaluation montre qu'Arboretum peut égaler le coût des systèmes antérieurs qui ont été optimisés manuellement pour des types particuliers de requêtes, et qu'il peut en outre prendre en charge une gamme de nouvelles requêtes pour lesquelles aucune solution efficace n'existe à l'heure actuelle.