Es ist gemeinhin bekannt, dass Produktionsdaten nicht zu Testzwecken benutzt werden dürfen. Die Datenschutz-Grundverordnung (DSGVO) besagt, dass persönlich identifizierbare Informationen nicht für Marketing, Training oder Tests benutzt werden dürfen. Andernfalls besteht das Risiko, dass persönliche Daten in die falschen Hände geraten oder ‘leaken’. Als Softwaretester oder Quality Engineer braucht man jedoch Produktionsdaten om Applikationen zu testen und dafür zu sorgen, dass sie in der Produktion richtig funktionieren. Wie benutzt man also Testdaten ohne die DSGVO zu übertreten? Glücklicherweise gibt es mehrere Wege wie man seine Testdaten DSGVO-konform aufbereiten kann, um mit hochwertigen Testdaten zu arbeiten:
Data maskingMit Datenmaskierung oder ‘Data Masking’ können Sie sensible Informationen verbergen, die in Ihrer Datenbank gespeichert sind. So können Angaben zu Gehältern, IBAN, Adressen, Sozialversicherungsnummern und Namen nicht mehr mit natürlichen Personen in Verbindung gebracht werden. Wann sind Informationen eigentlich sensibel und privat? Ein Name ist an sich keine sensible Information, die Tatsache, dass die Person mit diesem Namen einen Schuldenberg hat, schon. Mithilfe von Data Masking können Sie dafür sorgen, dass kleine Stücke Information nicht mehr miteinander in Verbindung gebracht werden können. Sie können zum Beispiel Namen ‘shufflen’, Texte oder Nummern ‘scramblen’, Geburtsdaten auf einen anderes Datum desselben Monats einstellen (sodass das Geburtsjahr noch brauchbar bleibt), ‘custom expressions’ benutzen, Felder schwärzen und noch vieles mehr. All diese Maskierungen helfen Ihnen dabei, Ihre persönlichen Daten zu beschützen. Synthetische DatengenerierungAlternativ können Sie für Testzwecke synthetische Daten generieren. Synthetische Daten können als Maskierungstechnik benutzt werden, Sie können aber auch komplett neue Daten generieren wenn Sie noch keine Datn als Ausgangspunkt haben. Dies ist zum Beispiel der Fall wenn Sie eine brandneue Appplikation testen, die noch nicht auf dem Markt ist. Synthetische Daten sind außerdem praktisch, um extreme oder auffällige Daten in Ihrem Set zu maskieren. Es ist zum Beispiel nicht schwierig zu erraten, wer in einem Unternehmen das höchste Einkommen hat. Mithilfe von synthetischen Daten ist es nicht mehr möglich, aufgrunf von auffälligen Informationen herzuleiten, um welche Person es sich handelt. Kombination beider TechnikenAn diesem Punkt is deutlich, dass die beste Methode eine Kombination aus Data Masking und synthetischer Datengenerierung ist. So können Sie die Vorteile beider Techniken benutzen. Einserseits bleiben Ihre Daten und deren Struktur intakt, sodass sie realitätsgetreu sind. Andererseits profitieren Sie von allen Vorteilen, die synthetische Daten bieten. FazitSowohl Data Masking als auch synthetische Datengenerierung helfen Ihnen, Ihre Testdaten DSGVO-konform aufzubereiten. Am besten kombinieren Sie beide Techniken, um ein qualitativ hochwertiges und sicheres Datenset zu erhalten. Mit einem guten Data Masking Tool maskieren Sie nicht nur Ihre Daten, sondern erstellen Sie auch einen auditreport. Mit dem Sie beweisen können, dass Sie Ihre Daten maskiert haben. Das ist ein praktisches Dokument für den nächsten Besuch verschiedener Behörden und Ämter. |