Anonymisierte Erfassung und Nutzung von Mobilit?ts- und Bewegungsdaten (AnoMoB)

IIP (Intelligenter Intermodaler Pendlerverkehr) aus dem Forschungsnetzwerk Anonymisierung des BMBF. Die Eckdaten des Projekts finden Sie hier.

    Konsortium

    Ergebnisse

    Multimodale Simulation von Personen mit SUMO

    Die Verkehrssimulationssoftware SUMO (Simulatio of Urban Mobility) wurde verwendet, um die Bewegungsabl?ufe im Alltag von Personen zu simulieren. Dazu wurde OpenStreetMap verwendet, um die Stadt Esslingen nachzubilden. Das Ziel war es, m?glichst realistische Bewegungsdaten zu erzeugen, mit denen die Use Cases des Projekts getestet werden k?nnen, ohne dafür personenbezogene Daten zu ben?tigen.

    Die Simulation beinhaltet die Personengruppen Arbeiter, Studenten, Schüler und Rentner. Jede Person bekommt ihre eigenen Points of Interest zu gewiesen wie einen Wohnort, Arbeitsstelle, Superm?rkte, etc. Die Personen führen in der Simulation mehrere Trips durch. Dafür k?nnen Sie entweder zu Fu? gehen, oder ein Transportmittel wie Auto, Motorrad, Fahrrad oder den ?PNV nehmen. In der Simulation fahren Busse, Bahnen, etc., anhand der realen Fahrpl?ne. Innerhalb eines Trips k?nnen auch mehrere Transportmittel zum Einsatz kommen. So kann eine Person zu Fu? von ihrer Wohnung zur Bushaltestelle laufen und von dort einen Bus zur Arbeit nehmen.

    Abbildung 1 und 2 zeigen verschiedene Ausschnitte einer laufenden Simulation. In blau sind die simulierten Personen zu sehen, in rot Autos. Au?erdem gibt es ?ffentliche Verkehrsmittel in verschiedenen Farben.

    Abbildung 3 zeigt eine ?bersicht aller Trajektorien aus einer Simulation, jeweils mit markiertem Start- und Endpunkt.

    Datensammelaktion für Pendeldaten von Angeh?rigen der Hochschule Esslingen

    K-Means mit homomorpher Verschlüsselung

    Mobilit?tsdaten und insbesondere Bewegungstrajektorien haben inh?rent einen hohen Personenbezug und sind deshalb besonders schützenswert. Auch wenn solche Datens?tze keine direkten Identifikatoren besitzen, ist es meist m?glich, Rückschlüsse auf die Identit?t einer Einzelperson sowie auf ihren Wohnort, ihre Arbeitsstelle, Sexualit?t, Religion, Gesundheitsstand, etc. zu ziehen.
    Mit homomorpher Verschlüsselung (Homomorphic Encryption (HE)) k?nnen Mobilit?tsdaten verschlüsselt an Datenverarbeiter weitergegeben werden. Die Analyse der Daten wird direkt auf den verschlüsselten Daten durchgeführt, sodass sinnvolle Erkenntnisse (z.B. für St?dteplanung) gewonnen werden k?nnen, ohne private Daten einsehen zu müssen.

    Clustering-Algorithmen wie der K-Means-Algorithmus sind ein h?ufig verwendetes Datenanalysewerkzeug. Sie k?nnen mithilfe von HE in vollst?ndig verschlüsselter Form berechnet werden. Die Clients verschlüsseln in diesem Fall ihre Koordinaten lokal, und versenden Sie dann erst an dern Server. Dieser berechnet dann das Clustering. Als Ergebnis werden lediglich die errechneten Clustermittelpunkte entschlüsselt.

    Diese Algorithmen k?nnen allerdings nicht ohne Weiteres verschlüsselt implementiert werden, da einige Operationen in dieser Form schwer zu berechnen sind. Der Vergleichsalgorithmus (a > b) is beispielsweise schwer zu berechnen und muss approximiert werden. Hierfür werden typischerweise spezielle Approximationspolynome definiert, die mit entsprechendem Grad die Vorzeichenfunktion hinreichend genau approximieren. Dadurch l?sst sich dann der Vergleich berechnen.

    Der K-Means Clustering Algorithmus wurde in vollst?ndig verschlüsselter Form implementiert. Als Sicherheitsparameter für das CKKS-Schema wurde 128 Bits gew?hlt, was zu einer Ringdimension von 2^16 führt und Bootstrapping erfordert. Der Testdatensatz bestand aus 6144 Positionsdaten von Personen in der Stadt Esslingen, deren Bewegungsdaten mithilfe einer SUMO-Simulation generiert wurden. K-Means wurde mit k = 2, 3, 4 ausgeführt. Die durchschnittliche Laufzeit pro Cluster pro Datenpunkt war  ~0.62 Sek. Durch die homomorphe Verschlüsselung mit CKKS ist das entschlüsselte Ergebnis leicht verrauscht. Die berechneten Clustermittelpunkte haben einen Fehler zwischen 45 - 204 cm.

    Erstellung anonymisierter Heatmaps mit homomorpher Verschlüsselung

    Eine simple M?glichkeit zur anonymisierten Darstellung von Mobilit?tsdaten, genauer gesagt einer Liste von Koordinaten, ist als Heatmap. Hierbei wird die Karte in Segmente aufgeteilt, und pro Segment wird die Anzahl der enthaltenen Punkte aufaddiert und als Farbverlauf dargestellt.

    Um für die Berechnung dieser Heatmap Input Privacy zu gew?hrleisten, k?nnen die einzelnen Punkte verschlüsselt werden, und die Berechnungen mittels homomorpher Verschlüsselung durchgeführt werden. Eine einfache Variante ist es, die Karte in ein gleichm??iges Gitter von Rechtecken aufzuteilen, auf die die Punkte verteilt werden. Eine komplexere, aber ebenfalls verschlüsselt berechenbare Methode ist es, die Heatmap aus Polygonen mit unregelm??igen Formen zu berechnen.

    Abbildung 1 zeigt eine Visualisierung von Punkten aus dem bekannten San Francisco Taxi Datensatz. in Abbildung 2 sieht man eine verschlüsselt berechnete Heatmap, bestehend aus Quadraten. Abbildung 3 zeigt schlie?lich eine verschlüsselt berechnete Heatmap auf Basis der Wahlbezirke in San Francisco.

    Synthetisierung anonymer Trajektorien mithilfe von Local Differential Privacy

    TBD

    Analyse von Carsharing-Nutzungsmustern

    Die Optimierung von MaaS-Angeboten erfordert eine Analyse der Carsharing-Nutzungsmuster. Um Verfahren zur Erkennung dieser Muster zu entwickeln, wurden die mit dem Simulationstool SUMO generierten Fahrtdaten in Esslingen verwendet. Ziel war es, typische Fahrtmuster anhand verschiedener Merkmale zu identifizieren, wie Beispielsweise die Position der Start- und Zielpunkte der Fahrten, Landnutzungsinformationen und der N?he zu Bildungseinrichtungen, Gesundheitseinrichtungen oder Freizeitangeboten. Diese Merkmale wurden für jeden Start- und Zielpunkt extrahiert und zu einer umfassenden Darstellung der Trajektorien kombiniert.

    Auf der Grundlage dieser Daten wurde eine Clusteranalyse mit verschiedenen Verfahren durchgeführt, darunter k-Means, MeanShift und hierarchisches Clustering mit Ward-Linkage. Die Ergebnisse wurden mit den Metriken wie dem Silhouette-Koeffizienten und dem Calinski-Harabasz-Index evaluiert. Der h?chste Calinski-Harabasz-Index wurde mit einer k-Means-basierten Modellkonfiguration mit 3 Clustern erreicht und die resultierenden Cluster sind in den Abbildungen 1 und 2 dargestellt. In Abbildung 1 sind sie im geographischen Merkmalsraum sichtbar, wobei die Punkte die Startpunkte der Trajektorien darstellen. Abbildung 2 zeigt die Projektion derselben Daten auf zwei Hauptkomponenten einer Principal-Component-Analyse (PCA). W?hrend man in der PCA-Ansicht zus?tzlich die Struktur des Merkmalsraums beobachten kann, kann man interessanterweise in der geographischen Darstellung auch teilweise die Struktur in der Trennung der Cluster erkennen.

    Abgesehen von den Start- und Zielpunkten wurden die Trajektorien selbst jedoch nicht für das Clustering verwendet. Da die Trajektorien durch eine gro?e Anzahl von Momentaufnahmen repr?sentiert werden, wurde zur weiteren Verbesserung der Analyse eine Transformation der Trajektorien in Bilder und eine Dimensionsreduktion mittels Autoencodern durchgeführt (siehe Abb. 3). Zukünftig sollen auch solche weniger dimensionalen Darstellungen von Trajektorien in die Clusterbildung einbezogen werden, um Muster in ihrer Form besser erfassen zu k?nnen. Ein m?glicher n?chster Schritt ist die Erweiterung des Ansatzes um generative Verfahren wie variationale Autoencoder. Diese k?nnten nicht nur zur Dimensionsreduktion, sondern auch zur Generierung synthetischer Mobilit?tsdaten verwendet werden, was zu datenschutzfreundlichen Analysen der Verkehrsdaten führen k?nnte. Eine weitere M?glichkeit, die Privatsph?re zu schützen, besteht darin, das Clustering direkt auf den mit homomorpher Verschlüsselung verschlüsselten Daten durchzuführen.

    Die beschriebenen Methoden werden auf die im Feldtest erhobenen Mobilit?tsdaten unter Berücksichtigung der Intermodalit?t angewendet. Zus?tzlich sollen die Verfahren, sofern m?glich, auf die MaaS-Daten des Projektpartners Cantamen übertragen werden.

    Ver?ffentlichungen, Poster und Vortr?ge

    TypDatumDetails
    Vortrag12.10.2023Konferenz “Mobilit?tsdaten – Use Cases, Herausforderungen, L?sungsans?tze” im Rahmen der Mobilit?tswoche der Hochschule Esslingen
    Vortrag & Poster22.02.20242. Osnabrücker IoT/Mobilit?tstagung, Osnabrück
    Vortrag14.03.2024Privacy Enhancing Technologies Conference (PET-CON), Berlin
    Vortrag & Workshop15.04.2024AnoSiDat Kongress: Anonymisierung für eine sichere Datennutzung, Lübeck
    Konferenz-Teilnahme25.06.-28.06.20242024 9th International Conference on Smart and Sustainable Technologies (SpliTech), Split
    Vortrag08.10.2024Conference on Anonymization of Integrated and Georeferenced Data, Berlin
    Vortrag & 2 Poster18.02.20253. Osnabrücker IoT/Mobilit?tstagung, Osnabrück
    Poster & Short Paper20.02.202512th International Conference on Information Systems Security & Privacy, Portugal
    Vortrag13.-14.03.2025Privacy Enhancing Technologies Conference (PET-CON), Dresden
    Poster18.-19.03.2025Nationale Konferenz IT-Sicherheitsforschung 2025 - Cybersicherheit und 老虎机游戏_老虎机游戏下载@, BMBF, Berlin
    Paper09.04.2025C. Krüger, B. Moriya, D. Schoop, ?A Performance Comparison of the Homomorphic Encryption Schemes CKKS and TFHE“, Computation & Communication For Smart Systems Symposium 2025, angenommen
    Paper09.04.2025R. R?hner, D. Ravlija, I. Trautwein, M. Sonntag, ?Data-Driven Approaches to Micromobility Demand Modeling“, Computation & Communication For Smart Systems Symposium 2025, angenommen
    Paper09.04.2025A. Efremidis, Ph. Walter, D. Hu, G. Gühring, ?Anonymization of Mobility Data and Meta Information using Local Differential Privacy in Combination with Bidirectional Graphs“, IEEE Transactions on Dependable and Secure Computing, angenommen
    Paper09.04.2025C. Dürr, G. Gühring, ?A Combined Approach of Heat Map Confusion and Local Differential Privacy for Anonymization of Mobility Data", Future Transportation, angenommen
    Paper09.04.2025D. Hu, G. Gühring, ?Improving Anonymization of Movement Trajectories with Map Matching Algorithm", Computation and Communication for Smart Systems Symposium 2025, Springer Nature Proceedings in Technology Transfer , angenommen
    Vortrag03.06.20256. IFG-Tage des Landesbeauftragten für 老虎机游戏_老虎机游戏下载@ und die Informationsfreiheit Baden-Württemberg, Esslingen
    Paper in Vorbereitung2025I. Trautwein, D. Ravlija, M. Sonntag, ?Data-based Insights into the usage of Micromobility Sharing"
    Paper in Vorbereitung2025NN, ?Leveraging Real Data to Simulate Trip Chains in Traffic Systems Using a Bayesian network“

     

     

    Kontakt

    Prof. Dr. Dominik Schoop

    +49 711 397-4467

    Dominik.Schoop@hs-esslingen.de

    apply

    Interesse geweckt? Bewirb dich! für das Wintersemester 2025/2026

    Ihre pers?nliche AnsprechpersonMelden Sie sich bei

    Foto Gabriele Gühring

    Prof. Dr. rer. nat. Gabriele Gühring

    Montag 11:15 Uhr - 12:15 Uhr

    in meinem pers?nlichen Webex Raum

    https://hs-esslingen.webex.com/meet/gabriele.guehring

    oder in meinem Büro F02.210

    Tel: +49 711 397-4376
    E-Mail: Gabriele.Guehring@hs-esslingen.de
    Nachricht senden