Sichere Datenkooperation dank kryptographischer Technologie

Dezember 2022

Linksight erleichtert es Parteien, sichere Datenkooperationen einzurichten. Hierfür haben wir drei Hauptpfeiler.

  • Das Linksight Netzwerk, ein dezentrales Netzwerk aus Datenstationen verbundener Parteien wie Krankenhäusern, Versicherungen und Kommunen. Diese Parteien können einander leicht finden und beliebig viele Datenkooperationen unter sich aufbauen.
  • Technologien zur Verbesserung der Privatsphäre (PETs), um innerhalb einer solchen Kooperation Datenschutz durch Technikgestaltung (Privacy by Design) bei der Datenanalyse zu ermöglichen, ohne sensible Daten zu teilen. Wir verwenden hierfür die neuesten PETs, wie homomorphe Verschlüsselung und sichere Multi-Party-Berechnung (MPC).
  • Data collaboration governance: Einrichten, die Möglichkeit zur Durchsetzung und Kontrolle der Vereinbarungen innerhalb einer Datenkooperation. Auf diese Weise behalten alle Parteien die Kontrolle darüber, wer was mit ihren Daten machen darf.

Eine Datenkooperation einrichten

Netzwerkteilnehmer können leicht eine Datenkooperation mit anderen Parteien einrichten. Linksight stellt eine sogenannte Datenstation bereit, eine Software, die im eigenen lokalen System oder in der Cloud jeder Partei installiert wird. Dann können sie sich mit anderen Organisationen verbinden, die ebenfalls eine solche Datenstation haben. Wir übernehmen die Authentifizierung, sodass jede Partei sicher sein kann, dass die Identität der anderen korrekt ist. Von ihrer Datenstation aus können Organisationen neue Datenkooperationen mit anderen Datenstationen aufbauen, die Regeln dafür definieren und untereinander Datenanalysen durchführen.

Verschlüsselungsmethoden

Aus der Toolbox der Datenschutztechnologien verwenden wir insbesondere die homomorphe Verschlüsselung. Das ist eine Verschlüsselungsmethode, um Analysen an Daten durchzuführen, während diese Daten zu jeder Zeit verschlüsselt und damit unlesbar bleiben. Am Ende einer Analyse wird nur das Endergebnis offenbart.

Statistik

Wir verwenden zwei Arten homomorpher Verschlüsselung: teilweise, die es Ihnen erlaubt, entweder zu addieren oder zu multiplizieren, und vollständige (Fully HE), die beides kann. Mit teilweiser Verschlüsselung können Sie alle Arten von deskriptiven Statistiken durchführen. So nutzen wir sie im Gesundheitswesen, um die Wirksamkeit von Interventionen zu berechnen. Mit vollständig homomorpher Verschlüsselung können viel komplexere Berechnungen durchgeführt werden. Diese nutzen wir beispielsweise für Regressionsanalysen. Für jede Art von Analyse wählen wir immer das Protokoll aus, das am besten dazu passt, unter Berücksichtigung von Faktoren wie Sicherheit, Geschwindigkeit und Erklärbarkeit.

Proportionale Offenlegung

In bestimmten Fällen ist es notwendig, Datenanalysen durchzuführen, um ein Bild über bestimmte Personen oder Unternehmen zu erhalten. Denken Sie an Betrugsprävention, bei der Datenbanken von Agenturen oder Banken kombiniert werden müssen, oder um festzustellen, wer Anspruch auf eine bestimmte Leistung oder Entschädigung hat. Dafür verwenden wir die Technologie private set intersection (PSI). Diese offenbart nur jene Personen, die Kriterien über mehrere Parteien hinweg erfüllen, ohne alle anderen Personen zu offenbaren, die sie nicht erfüllen. Auch hier ist unser Data collaboration governance wichtig, um genau zu definieren, wer was mit diesen Daten machen darf, und das transparent und auditierbar zu machen.

Föderiertes Lernen

Für einige Anwendungen verwenden wir keine kryptographischen Methoden, sondern eher Technologien, die auf maschinellem Lernen basieren, um gemeinschaftliche Datenanalysen durchzuführen. Hier sprechen wir über föderiertes Lernen (FL), eine Methode zur Optimierung von Datenmodellen über unterschiedliche Parteien hinweg, die immer bessere Vorhersagen ermöglicht, um beispielsweise die Versorgung zu verbessern oder in anderen Bereichen.

Data collaboration governance

Datenkooperation erfordert klare Vereinbarungen zwischen den Parteien und deren peinliche Einhaltung. Unsere einzigartige Data collaboration governance stellt sicher, dass die Parteien die Kontrolle über die Kooperation behalten und technisch durchsetzen können, was innerhalb dieser geschieht. So ermöglicht beispielsweise die Plattform die Vorabfestlegung, welche Partei welche Analyse unter welchen Bedingungen durchführen darf, und es gibt Regeln für statistische Offenlegungskontrolle. Jede Handlung außerhalb dieser Vereinbarungen wird durch das System blockiert.

FAIR Data

Transparenz ist hier essentiell. Im Voraus stellen die Parteien Datenbeschreibungen (FAIR) bereit, die definieren, wie ihre Daten aufgebaut sind und was ihre Daten bedeuten. Dies ermöglicht den anderen Parteien zu verstehen, wie sie diese Daten nutzen können und was die Qualität ist.

Audit-Trail

Transparenz gilt auch rückwirkend. Jede durchgeführte Analyse und jede Änderung in den Kooperationsregeln werden unveränderlich im dezentralen Netzwerk aufgezeichnet. So kann immer nachgewiesen werden, welche Partei wann welche Analyse unter welchen Bedingungen durchgeführt hat. Für diesen dezentralen Audit-Trail verwenden wir Blockchain-Technologie, sodass die Parteien für diesen Audit-Trail nicht von Linksight abhängig sind, sondern er wird redundant und unbestreitbar von verschiedenen Servern gepflegt.