Veilige datasamenwerking dankzij cryptografische techniek
december 2022Linksight maakt het partijen makkelijk veilige datasamenwerkingen op te zetten. Daarvoor hebben we drie belangrijke pijlers.
- Het Linksight netwerk, een decentraal netwerk van datastations van aangesloten partijen zoals ziekenhuizen, verzekeraars en gemeenten. Deze partijen kunnen elkaar makkelijk vinden en onderling zoveel datasamenwerkingen opzetten als zij willen.
- Privacy enhancing technologies (PETs) om binnen zo’n samenwerking privacy-by-design data-analyse te doen zonder gevoelige data te delen. We gebruiken daarvoor de nieuwste PETs, zoals homomorfe encryptie en secure multiparty computation (MPC).
- Data collaboration governance: het opstellen, technisch kunnen afdwingen en controleren van de afspraken binnen een datasamenwerking. Op die manier houden alle partijen controle over wie wat met hun data kan doen.
Datasamenwerking opzetten
Deelnemers aan het netwerk kunnen eenvoudig datasamenwerking opzetten met andere partijen. Linksight levert een zogeheten datastation, software die bij elke partij in het eigen lokale systeem of cloud wordt geïnstalleerd. Ze kunnen dan verbinding maken met andere organisaties die ook zo’n datastation hebben. Wij doen de authenticatie, zodat elke partij zeker weet dat identiteit van de ander correct is. Vanuit hun datastation kunnen organisaties nieuwe datasamenwerkingen met andere datastations opzetten, daar de regels van bepalen en onderling data-analyses uitvoeren.
Encryptiemethoden
Uit de gereedschapskist van privacytechnologieën gebruiken we met name homomorfe encryptie. Dat is een versleutelingsmethode om analyses uit te kunnen voeren op data terwijl die data steeds versleuteld en dus onleesbaar blijft. Aan het eind van een analyse wordt alleen het eindresultaat onthuld.
Statistiek
We gebruiken twee soorten homomorfe encryptie: partiële, waarmee je óf kunt optellen óf vermenigvuldigen, en volledige (Fully HE) die beide berekeningen kan uitvoeren. Met partiële encryptie kun je allerlei vormen van beschrijvende statistiek uitvoeren. We gebruiken die bijvoorbeeld in de zorgsector om de effectiviteit van interventies te berekenen. Met volledig homomorfe encryptie zijn veel complexere berekeningen te doen. We gebruiken dit bijvoorbeeld voor regressie-analyses. Per type analyse kiezen wij steeds het protocol wat daar het beste bij past, waarbij we een rekening houden met factoren zoals veiligheid, snelheid, en uitlegbaarheid.
Proportioneel onthullen
In bepaalde gevallen is het nodig om data-analyses te doen om bepaalde personen of bedrijven in beeld te krijgen. Denk aan fraudebestrijding, waarbij je gegevensbestanden van instanties of banken moet combineren, of om te bepalen wie recht heeft op een bepaalde uitkering of vergoeding. Daarvoor gebruiken we de technologie private set intersection (PSI). Hiermee worden alleen die individuen onthuld die voldoen aan criteria bij meerdere partijen, zonder alle andere individuen te onthullen die daar niet aan voldoen. Ook hier is onze “data collaboration governance” belangrijk, om precies vast te leggen wie wat mag doen met deze data, en dat transparant en auditeerbaar te maken.
Federated learning
Voor sommige toepassingen gebruiken we geen cryptografische methoden, maar meer op machine learning gebaseerde technologieën om gezamenlijke data-analyses te doen. Dan hebben we het over federated learning (FL), een methode om datamodellen te optimaliseren over verschillende partijen heen, waardoor steeds betere voorspellingen mogelijk zijn gericht op verbetering van de zorg of in andere domeinen.
Data collaboration governance
Datasamenwerking vraagt om duidelijke afspraken tussen partijen en het nauwgezet nakomen daarvan. Onze unieke data collaboration governance zorgt ervoor dat partijen controle houden over de samenwerking en technisch kunnen afdwingen wat er daarbinnen gebeurt. Zo is op het platform vooraf in te stellen welke partij onder welke voorwaarden welke analyse mag doen en zijn er regels voor statistical disclosure control (het voorkomen van ongewenste onthulling). Elke handeling buiten deze afspraken wordt door het systeem geblokkeerd.
FAIR data
Transparantie is hier essentieel. Vooraf geven partijen databeschrijvingen (FAIR) waarin is vastgelegd hoe hun data is opgebouwd en wat hun data betekent. Zo kunnen de andere partijen begrijpen hoe ze die data kunnen gebruiken, en wat de kwaliteit is.
Audit trail
Transparantie geldt ook achteraf. Elke uitgevoerde analyse en elke verandering van de samenwerkingsregels wordt onveranderbaar vastgelegd in het decentrale netwerk. Zo is achteraf altijd te bewijzen welke partij wanneer welke analyse heeft uitgevoerd, onder welke voorwaarden. Voor deze decentrale audit trail gebruiken we blockchain technologie, zodat partijen voor deze audit trail niet afhankelijk zijn van Linksight, maar deze door verschillende servers redundant en onweerlegbaar wordt bijgehouden.