John Krumm
John Krumm est diplômé de l'école d'informatique de l'Université Carnegie Mellon, avec un doctorat en robotique et une thèse sur l'analyse des textures dans les images. Il a travaillé au Robotics Center des Sandia National Laboratories à Albuquerque, au Nouveau-Mexique.
Il est actuellement directeur associé du Integrated Media Systems Center à la Viterbi School of Engineering de l'Université de Californie du Sud. Ses recherches portent sur la compréhension de la localisation des personnes et la confidentialité des données personnelles.
Il est président du comité exécutif d'ACM SIGSPATIAL et fait partie du comité consultatif scientifique de la division "Geospatial Science and Human Security" de l'Oak Ridge National Laboratory.
Il rejoint l'IEA de Paris en janvier 2024 pour une résidence d'écriture d'un mois.
Sujets de recherche
Mobilité humaine, confidentialité des données personnelles, traitement géospatial.
Le pouvoir de l'imprécision sur la vie privée
Lorsque nous partageons nos données privées, le destinataire dispose non seulement de ces données, mais il peut aussi les utiliser pour déduire d'autres choses à notre sujet. Par exemple, si vous communiquez votre âge, votre sexe et votre adresse à une grande société Internet, celle-ci pourra en déduire vos revenus, vos opinions politiques et votre niveau d'éducation. Nous pouvons réduire la précision des déductions et renforcer notre vie privée en restant vagues. Par exemple, nous pouvons ne communiquer qu'une fourchette d'âge au lieu de notre âge réel.
Ce projet vise à comprendre comment l'imprécision affecte la précision des inférences à partir de données personnelles.
Pour comprendre comment l'âge d'une personne peut être utilisé pour déduire ses revenus, on peut utiliser une simple distribution de probabilité conjointe de l'âge et du revenu. Pourtant il existe une distribution conjointe plus large, souvent approximée par un réseau neuronal profond, qui donne la relation probabiliste entre des dizaines de variables personnelles différentes. L'examen d'une telle distribution permet de mieux comprendre :
- Que peut-on déduire de la révélation de quelques détails personnels ?
- Comment cela change-t-il si une personne donne des réponses floues, comme une fourchette d'âge au lieu d'un âge précis ?
- Comment les déductions sont-elles affectées si une personne ment au sujet de ses données personnelles ? Quels sont les meilleurs mensonges pour brouiller les déductions ?
- Certaines inférences sont plus sensibles que d'autres, par exemple une inférence sur les revenus peut être plus sensible qu'une inférence sur les préférences en matière d'équipes sportives. Comment la sensibilité des déductions affecte-t-elle la sensibilité des révélations sur les données personnelles ?
- Une entreprise recevant des données personnelles ne révélera probablement pas les secrets commerciaux de ce qu'elle peut déduire. Comment un individu peut-il encore faire des choix intelligents sur ce qu'il doit révéler étant donné l'incertitude de l'individu sur ce que l'entreprise peut déduire ?
Il existe une théorie sous-jacente simple qui peut répondre à ces questions, en utilisant les probabilités conjointes, l'espérance probabiliste et éventuellement la théorie de l'information. Il peut être facile d'illustrer cette théorie à l'aide de données de recensement, qui apporteront des réponses aux questions ci-dessus. Ce projet peut déboucher sur des lignes directrices pratiques et concrètes concernant les conséquences et les meilleures pratiques en matière de divulgation de données personnelles.
Publications récentes
Banovic, Nikola, and John Krumm. "Warming Up to Cold Start Personalization." Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies 1, no. 4 (2018): 1-13. (link)
Krumm, John. "Sensitivity Analysis of Personal Location Disclosure." In 2022 23rd IEEE International Conference on Mobile Data Management (MDM), pp. 73-82. IEEE, 2022. (link)
Krumm, John. "Maximum entropy bridgelets for trajectory completion." In Proceedings of the 30th International Conference on Advances in Geographic Information Systems, pp. 1-8. 2022. (link)