Maskování dat (Data Masking)

Vývoj nových verzí aplikací a jejich testování vyžaduje reálná data, na základě kterých lze důkladně ověřit funkčnost a odstranit případné chyby před uvedením do provozu. Většina společností pro tyto účely používá různé kopie provozních (tj. „ostrých“) dat. Ještě v nedávné době bylo zcela běžné poskytovat vývojářům a testerům provozní data bez jakýchkoliv úprav. Dnes se již situace naštěstí mění, jelikož společnosti pociťují stále větší tlak na zabezpečení dat před únikem citlivých informací do nepovolaných rukou. Jednak každý medializovaný únik dat snižuje důvěryhodnost společnosti – se všemi svými negativními důsledky, hlavně je ale důsledné zabezpečení citlivých dat přímo zakotveno v legislativě a regulačních opatřeních – Zákon č. 101/2000 Sb., o ochraně osobních údajů, Basel II, Safe Harbor (program Evropské komise na ochranu dat), PCI DSS (standard zabezpečení dat pro operace s platebními kartami), atd.

Zákon č. 101/2000 Sb., o ochraně osobních údajů - §13 Povinnosti osob při zabezpečení osobních údajů:

(1) Správce a zpracovatel jsou povinni přijmout taková opatření, aby nemohlo dojít k neoprávněnému nebo nahodilému přístupu k osobním údajům, k jejich změně, zničení či ztrátě, neoprávněným přenosům, k jejich jinému neoprávněnému zpracování, jakož i k jinému zneužití osobních údajů. Tato povinnost platí i po ukončení zpracování osobních údajů.

(2) Správce nebo zpracovatel je povinen zpracovat a dokumentovat přijatá a provedená technicko-organizační opatření k zajištění ochrany osobních údajů v souladu se zákonem a jinými právními předpisy.

Tradiční mechanizmy pro zabezpečení provozních dat – firewally, šifrování dat, přístupová hesla – nefungují pro vývoj a testování aplikací, protože vývojáři a testeři potřebují pro svou práci přístup k nezašifrovaným, platným datům. Použití reálných dat ale znamená vysoké riziko jejich zneužití.

Analytická společnost Forrester odhaduje, že 70% všech úniků dat je zapříčiněno interními útoky, tj. vlastními zaměstnanci nebo interně působícími pracovníky partnerských společností. (report „Market Overview: Database Security“, únor 2009)

 

Řešením je použití technologie maskování dat. V porovnání s šifrováním dat nebo jinými klasickými technikami zabezpečení dat, představuje maskování dat zcela jiný přístup k problematice ochrany dat. Zamaskovaná /de-identifikovaná/ data, jsou umělá, avšak reálně vyhlížející data, která mají stejný statistický charakter jako původní provozní data, včetně zachované datové integrity a vazeb mezi objekty a aplikacemi. Těmito daty lze plnohodnotně nahradit provozní „ostrá“ data pro účely výzkumu, vývoje a testování, při současné eliminaci rizika úniku citlivých dat. Zamaskovaná data nejsou pro hackery zajímavá, protože již neobsahují citlivé údaje a nelze z nich zpětně odvodit původní data – pokud je proces maskování proveden kvalitně.

„Technologie maskování dat musí splnit jednoduché základní pravidlo: Aplikace běžící nad zamaskovanými daty musí fungovat úplně stejně, jako by se jednalo o reálná data. Maskování dat nesmí žádným způsobem omezovat vývojáře a testery v jejich práci“ – Joseph Feiman, Gartner.

Význam maskování dat:

  • odstranění citlivých dat z vývojového, testovacího a školícího prostředí vede k eliminaci rizika jejich úniku, a umožňuje poskytnutí provozních dat bez citlivých údajů i třetím stranám (např. outsourcing vývoje aplikací)
  • poskytuje funkční, realistická data pro vývoj a testování aplikací, školení, statistické analýzy, atd.
  • maskování dat na celopodnikové úrovni produkuje konzistentní testovací data se zachovanou datovou integritou skrze více aplikací
  • pomáhá společnostem splnit legislativní a regulační opatření na ochranu dat
  • chrání před vnitřními útoky na data v ne-produkčních prostředích

 

Maskování dat neřeší problém jak znemožnit krádež dat, ale jak znemožnit využití ukradených dat.


Jak vybrat vhodné řešení pro maskování dat?

„Kritéria pro výběr řešení pro maskování dat by měla zahrnovat typické praktické požadavky – podpora více platforem a databází, reálnost maskovaných dat, podpora řízení procesů a závislostí“ – Gartner, červenec 2008

Zaměření na maskování dat

V prvé řadě zvažte řešení, které je od začátku zaměřeno na maskování dat. Řešení původně určená k jiným účelům a později modifikovaná pro maskování mohou mít příliš vekou režii – např. 2 hod. maskování versus 10 hod.

Možnosti

Řešení by Vám mělo umožnit maskovat všechna data způsobem, který požadujete, ale aniž byste museli pro každou položku vyvíjet vlastní algoritmy. Mezi základní podporované operace by měla patřit jednoduchá náhrada hodnot (např. nahraď všechna jména hodnotou „Jan“), promíchání hodnot mezi záznamy, generování náhodných hodnot podle pravidel (např. validní rodné čísla), náhrada hodnot z externího číselníku (např. číselník adres, jmen), stejně tak i komplikovanější operace jako generování čísel kreditních karet (s validním prefixem a kontrolním součtem).

Platformy a databáze

Optimální řešení by mělo podporovat různé databázové systémy (RDBMS), operační systémy (Linux, Unix, Windows) a vyvinuté procesy by měly být přenosné mezi platformami.

Databázové koncepty

Řešení by mělo správně pracovat s klíčovými databázovými koncepty jako filtry (např. pouze Mastercard), skupinami (např. typy kreditních karet), referenční integritou. A musí být schopno maskovat primární klíče!

Reusabilita

Hledejte řešení, které nebudete muset přepracovávat když změníte databázi nebo schéma. Které umožní využít jednou vytvořené objekty pro více databází a aplikací, ve kterém lze maskovací procesy spouštět automatizovaně na serverové platformě.

Konzistence

V neposlední řadě, pokud budete chtít řešení využít na celopodnikové úrovni, musí být maskovací procesy konzistentní skrze různé databáze a systémy. Jestliže např. bude „Adam Berka“ maskován na „Alexandr Beneš“ v HR systému, musí být stejně maskován i ostatních systémech. Jinak nebude možné provádět konzistentní testování zahrnující více systémů najednou.

Pokud hledáte řešení pro maskování dat nebo chcete jen získat přehled o možnostech současných technologií v této oblasti, velmi rádi Vám poskytneme vyčerpávající informace.

 

data_masking.jpg

obrázek: příklad maskování dat (jméno a příjmení, rodné číslo, kreditní karta, adresa)

 

anonymizace_oblicej.jpg

obrázek: konzistentní maskování (zachování všech atributů) versus nekonzistentní (změna pohlaví)


Klíčová slova: maskování dat, anonymizace dat, deperzonifikace dat, špinění dat, de-identifikace dat, data masking, de-identification, desensitization, data scrubbing, depersonalization, obfuscation

© 2010 INFA Partner, s.r.o