Wat is die datamaskeringstegnologie en -oplossing in Network Packet Broker?

1. Die konsep van datamaskering

Datamaskering staan ​​ook bekend as datamaskering. Dit is 'n tegniese metode om sensitiewe data soos selfoonnommers, bankkaartnommers en ander inligting te omskep, te wysig of te bedek wanneer ons maskeringsreëls en -beleide gegee het. Hierdie tegniek word hoofsaaklik gebruik om te verhoed dat sensitiewe data direk in onbetroubare omgewings gebruik word.

Datamaskeringsbeginsel: Datamaskering moet die oorspronklike data-eienskappe, besigheidsreëls en data-relevansie behou om te verseker dat die daaropvolgende ontwikkeling, toetsing en data-analise nie deur maskering beïnvloed sal word nie. Verseker data-konsekwentheid en -geldigheid voor en na maskering.

2. Datamaskering-klassifikasie

Datamaskering kan verdeel word in statiese datamaskering (SDM) en dinamiese datamaskering (DDM).

Statiese datamaskering (SDM)Statiese datamaskering vereis die vestiging van 'n nuwe nie-produksieomgewingdatabasis vir isolasie van die produksieomgewing. Sensitiewe data word uit die produksiedatabasis onttrek en dan in die nie-produksiedatabasis gestoor. Op hierdie manier word die gedesensitiseerde data van die produksieomgewing geïsoleer, wat aan die besigheidsbehoeftes voldoen en die sekuriteit van produksiedata verseker.

SDM

Dinamiese datamaskering (DDM)Dit word oor die algemeen in die produksiemgewing gebruik om sensitiewe data intyds te desensibiliseer. Soms is verskillende vlakke van maskering nodig om dieselfde sensitiewe data in verskillende situasies te lees. Byvoorbeeld, verskillende rolle en toestemmings kan verskillende maskeringskemas implementeer.

DDM

Dataverslagdoening en dataprodukte-maskeringtoepassing

Sulke scenario's sluit hoofsaaklik interne datamoniteringsprodukte of -reklameborde, eksterne diensdataprodukte en verslae gebaseer op data-analise, soos besigheidsverslae en projekoorsigte, in.

dataverslagdoening produkmaskering

3. Datamaskeringoplossing

Algemene datamaskeringskemas sluit in: ongeldigmaking, ewekansige waarde, datavervanging, simmetriese enkripsie, gemiddelde waarde, verrekening en afronding, ens.

OngeldigmakingOngeldigmaking verwys na die enkripsie, afkorting of wegsteek van sensitiewe data. Hierdie skema vervang gewoonlik werklike data met spesiale simbole (soos *). Die bewerking is eenvoudig, maar gebruikers kan nie die formaat van die oorspronklike data ken nie, wat daaropvolgende datatoepassings kan beïnvloed.

Willekeurige WaardeDie ewekansige waarde verwys na die ewekansige vervanging van sensitiewe data (syfers vervang syfers, letters vervang letters, en karakters vervang karakters). Hierdie maskeringsmetode sal die formaat van sensitiewe data tot 'n sekere mate verseker en daaropvolgende datatoepassing vergemaklik. Maskeringswoordeboeke mag nodig wees vir sommige betekenisvolle woorde, soos name van mense en plekke.

DatavervangingDatavervanging is soortgelyk aan die maskering van nul- en ewekansige waardes, behalwe dat die maskeringsdata met 'n spesifieke waarde vervang word in plaas van spesiale karakters of ewekansige waardes te gebruik.

Simmetriese EnkripsieSimmetriese enkripsie is 'n spesiale omkeerbare maskeringsmetode. Dit enkripteer sensitiewe data deur enkripsiesleutels en algoritmes. Die gekisfereerde teksformaat is konsekwent met die oorspronklike data in logiese reëls.

GemiddeldDie gemiddelde skema word dikwels in statistiese scenario's gebruik. Vir numeriese data bereken ons eers hul gemiddelde, en versprei dan die gedesensitiseerde waardes ewekansig rondom die gemiddelde, waardeur die som van die data konstant bly.

Verrekening en AfrondingHierdie metode verander die digitale data deur ewekansige verskuiwing. Die afronding verseker die benaderde egtheid van die reeks terwyl die sekuriteit van die data gehandhaaf word, wat nader aan die werklike data is as die vorige skemas, en het groot betekenis in die scenario van groot data-analise.

ML-NPB-5660-数据脱敏

Die Aanbevole Model "ML-NPB-5660"vir die Datamaskering

4. Algemeen gebruikte datamaskeringstegnieke

(1). Statistiese Tegnieke

Data-steekproefneming en data-aggregasie

- Datasteekproefneming: Die analise en evaluering van die oorspronklike datastel deur 'n verteenwoordigende deelversameling van die datastel te kies, is 'n belangrike metode om die doeltreffendheid van de-identifikasietegnieke te verbeter.

- Data-aggregasie: As 'n versameling statistiese tegnieke (soos opsomming, telling, gemiddelde, maksimum en minimum) wat op eienskappe in mikrodata toegepas word, is die resultaat verteenwoordigend van alle rekords in die oorspronklike datastel.

(2). Kriptografie

Kriptografie is 'n algemene metode om desensitisering te desensibiliseer of die doeltreffendheid daarvan te verbeter. Verskillende tipes enkripsie-algoritmes kan verskillende desensitiseringseffekte bereik.

- Deterministiese enkripsie: 'n Nie-ewekansige simmetriese enkripsie. Dit verwerk gewoonlik ID-data en kan die geënkripteerde teks dekripteer en herstel na die oorspronklike ID wanneer nodig, maar die sleutel moet behoorlik beskerm word.

- Onomkeerbare enkripsie: Die hash-funksie word gebruik om data te verwerk, wat gewoonlik vir ID-data gebruik word. Dit kan nie direk ontsyfer word nie en die karteringsverwantskap moet gestoor word. Boonop kan databotsings voorkom as gevolg van die kenmerk van die hash-funksie.

- Homomorfiese enkripsie: Die gekisfereerde teks-homomorfiese algoritme word gebruik. Die kenmerk daarvan is dat die resultaat van die gekisfereerde teksbewerking dieselfde is as dié van gewone teksbewerking na dekripsie. Daarom word dit algemeen gebruik om numeriese velde te verwerk, maar dit word nie wyd gebruik om prestasieredes nie.

(3). Stelseltegnologie

Die onderdrukkingstegnologie verwyder of beskerm data-items wat nie aan privaatheidsbeskerming voldoen nie, maar publiseer dit nie.

- Maskering: dit verwys na die mees algemene desensibiliseringsmetode om die attribuutwaarde te masker, soos die teenstandernommer, ID-kaart wat met 'n asterisk gemerk is, of die adres wat afgekap is.

- Lokale onderdrukking: verwys na die proses van die verwydering van spesifieke attribuutwaardes (kolomme), die verwydering van nie-essensiële datavelde;

- Rekordonderdrukking: verwys na die proses van die verwydering van spesifieke rekords (rye), die verwydering van nie-essensiële datarekords.

(4). Skuilnaamtegnologie

Pseudomanning is 'n de-identifikasietegniek wat 'n skuilnaam gebruik om 'n direkte identifiseerder (of ander sensitiewe identifiseerder) te vervang. Skuilnaamtegnieke skep unieke identifiseerders vir elke individuele inligtingsubjek, in plaas van direkte of sensitiewe identifiseerders.

- Dit kan onafhanklik ewekansige waardes genereer om ooreen te stem met die oorspronklike ID, die karteringstabel stoor en die toegang tot die karteringstabel streng beheer.

- Jy kan ook enkripsie gebruik om skuilname te produseer, maar jy moet die dekripsiesleutel behoorlik bewaar;

Hierdie tegnologie word wyd gebruik in die geval van 'n groot aantal onafhanklike datagebruikers, soos OpenID in die oop platform scenario, waar verskillende ontwikkelaars verskillende OpenID's vir dieselfde gebruiker verkry.

(5). Veralgemeningstegnieke

Veralgemeningstegniek verwys na 'n de-identifikasietegniek wat die granulariteit van geselekteerde eienskappe in 'n datastel verminder en 'n meer algemene en abstrakte beskrywing van die data verskaf. Veralgemeningstegnologie is maklik om te implementeer en kan die egtheid van rekordvlakdata beskerm. Dit word algemeen in dataprodukte of dataverslae gebruik.

- Afronding: behels die keuse van 'n afrondingbasis vir die gekose kenmerk, soos opwaartse of afwaartse forensiese ondersoeke, wat resultate van 100, 500, 1K en 10K lewer.

- Bo- en onderkoderingstegnieke: Vervang waardes bo (of onder) die drempel met 'n drempel wat die boonste (of onderste) vlak verteenwoordig, wat 'n resultaat van "bo X" of "onder X" lewer.

(6). Willekeurige tegnieke

As 'n soort de-identifikasietegniek verwys ewekansigheidstegnologie na die wysiging van die waarde van 'n attribuut deur ewekansigheid, sodat die waarde na ewekansigheid verskil van die oorspronklike werklike waarde. Hierdie proses verminder die vermoë van 'n aanvaller om 'n attribuutwaarde van ander attribuutwaardes in dieselfde datarekord af te lei, maar beïnvloed die egtheid van die resulterende data, wat algemeen is met produksietoetsdata.


Plasingstyd: 27 September 2022