Wat is die datamaskeringstegnologie en -oplossing in Network Packet Broker?

1. Die konsep van datamaskering

Datamaskering staan ​​ook bekend as datamaskering.Dit is 'n tegniese metode om sensitiewe data soos selfoonnommer, bankkaartnommer en ander inligting om te skakel, te verander of te dek wanneer ons maskeringsreëls en -beleide gegee het.Hierdie tegniek word hoofsaaklik gebruik om te verhoed dat sensitiewe data direk in onbetroubare omgewings gebruik word.

Datamaskering-beginsel: Datamaskering moet die oorspronklike data-eienskappe, besigheidsreëls en data-relevansie handhaaf om te verseker dat die daaropvolgende ontwikkeling, toetsing en data-analise nie deur maskering geraak sal word nie.Verseker data konsekwentheid en geldigheid voor en na maskering.

2. Data Maskering klassifikasie

Datamaskering kan verdeel word in statiese datamaskering (SDM) en dinamiese datamaskering (DDM).

Statiese datamaskering (SDM): Statiese datamaskering vereis die vestiging van 'n nuwe nie-produksie omgewing databasis vir isolasie van die produksie omgewing.Sensitiewe data word uit die produksiedatabasis onttrek en dan in die nie-produksiedatabasis gestoor.Op hierdie manier word die gedesensitiseerde data van die produksie-omgewing geïsoleer, wat aan besigheidsbehoeftes voldoen en die sekuriteit van produksiedata verseker.

SDM

Dinamiese datamaskering (DDM): Dit word gewoonlik in die produksie-omgewing gebruik om sensitiewe data in reële tyd te desensitiseer.Soms word verskillende vlakke van maskering vereis om dieselfde sensitiewe data in verskillende situasies te lees.Byvoorbeeld, verskillende rolle en toestemmings kan verskillende maskeringskemas implementeer.

DDM

Data verslagdoening en data produkte maskering toepassing

Sulke scenario's sluit hoofsaaklik interne datamoniteringsprodukte of advertensiebord, eksterne diensdataprodukte en verslae gebaseer op data-analise in, soos besigheidsverslae en projekhersiening.

data verslagdoening produk maskering

3. Datamaskeringsoplossing

Algemene datamaskeringskemas sluit in: ongeldigmaking, ewekansige waarde, datavervanging, simmetriese enkripsie, gemiddelde waarde, verrekening en afronding, ens.

Ongeldigmaking: Ongeldigverklaring verwys na die enkripsie, afkapping of verberging van sensitiewe data.Hierdie skema vervang gewoonlik werklike data met spesiale simbole (soos *).Die operasie is eenvoudig, maar gebruikers kan nie die formaat van die oorspronklike data ken nie, wat daaropvolgende datatoepassings kan beïnvloed.

Ewekansige waarde: Die ewekansige waarde verwys na die ewekansige vervanging van sensitiewe data (syfers vervang syfers, letters vervang letters en karakters vervang karakters).Hierdie maskeringsmetode sal die formaat van sensitiewe data tot 'n sekere mate verseker en die daaropvolgende datatoepassing vergemaklik.Maskerwoordeboeke kan nodig wees vir sommige betekenisvolle woorde, soos name van mense en plekke.

Data vervanging: Datavervanging is soortgelyk aan die maskering van nul- en ewekansige waardes, behalwe dat in plaas daarvan om spesiale karakters of ewekansige waardes te gebruik, word die maskeringsdata met 'n spesifieke waarde vervang.

Simmetriese enkripsie: Simmetriese enkripsie is 'n spesiale omkeerbare maskeringsmetode.Dit enkripteer sensitiewe data deur enkripsiesleutels en algoritmes.Die syferteksformaat stem ooreen met die oorspronklike data in logiese reëls.

Gemiddeld: Die gemiddelde skema word dikwels in statistiese scenario's gebruik.Vir numeriese data, bereken ons eers hul gemiddelde, en versprei dan die gedesensitiseerde waardes ewekansig rondom die gemiddelde, en hou dus die som van die data konstant.

Offset en Afronding: Hierdie metode verander die digitale data deur ewekansige verskuiwing.Die offset-afronding verseker die benaderde egtheid van die reeks, terwyl die sekuriteit van die data gehandhaaf word, wat nader aan die werklike data is as die vorige skemas, en groot betekenis het in die scenario van grootdata-analise.

ML-NPB-5660-数据脱敏

Die aanbevole model "ML-NPB-5660" vir die datamaskering

4. Algemeen gebruikte datamaskeringstegnieke

(1).Statistiese tegnieke

Datasteekproefneming en data-aggregasie

- Datasteekproefneming: Die ontleding en evaluering van die oorspronklike datastel deur 'n verteenwoordigende subset van die datastel te kies is 'n belangrike metode om die doeltreffendheid van de-identifikasietegnieke te verbeter.

- Data-aggregasie: As 'n versameling statistiese tegnieke (soos opsomming, tel, gemiddelde, maksimum en minimum) wat op eienskappe in mikrodata toegepas word, is die resultaat verteenwoordigend van alle rekords in die oorspronklike datastel.

(2).Kriptografie

Kriptografie is 'n algemene metode om die doeltreffendheid van desensibilisering te desensibiliseer of te verbeter.Verskillende tipes enkripsiealgoritmes kan verskillende desensibiliseringseffekte bereik.

- Deterministiese enkripsie: 'n Nie-ewekansige simmetriese enkripsie.Dit verwerk gewoonlik ID-data en kan die syferteks dekripteer en herstel na die oorspronklike ID wanneer nodig, maar die sleutel moet behoorlik beskerm word.

- Onomkeerbare enkripsie: Die hash-funksie word gebruik om data te verwerk, wat gewoonlik vir ID-data gebruik word.Dit kan nie direk gedekripteer word nie en die karteringverhouding moet gestoor word.Daarbenewens, as gevolg van die kenmerk van die hash-funksie, kan databotsing voorkom.

- Homomorfiese enkripsie: Die syferteks homomorfiese algoritme word gebruik.Die kenmerk daarvan is dat die resultaat van syferteksbewerking dieselfde is as dié van gewone teks bewerking na dekripsie.Daarom word dit algemeen gebruik om numeriese velde te verwerk, maar dit word nie wyd gebruik om prestasieredes nie.

(3).Stelsel Tegnologie

Die onderdrukkingstegnologie verwyder of beskerm data-items wat nie aan privaatheidsbeskerming voldoen nie, maar publiseer dit nie.

- Maskering: dit verwys na die mees algemene desensibiliseringsmetode om die kenmerkwaarde te masker, soos die opponentnommer, ID-kaart is met 'n asterisk gemerk, of die adres is afgekap.

- Plaaslike onderdrukking: verwys na die proses van die verwydering van spesifieke kenmerkwaardes (kolomme), die verwydering van nie-noodsaaklike datavelde;

- Rekordonderdrukking: verwys na die proses om spesifieke rekords (rye) uit te vee, nie-noodsaaklike datarekords uit te vee.

(4).Skuilnaam Tegnologie

Pseudomanning is 'n de-identifikasie tegniek wat 'n skuilnaam gebruik om 'n direkte identifiseerder (of ander sensitiewe identifiseerder) te vervang.Skuilnaamtegnieke skep unieke identifiseerders vir elke individuele inligtingsubjek, in plaas van direkte of sensitiewe identifiseerders.

- Dit kan ewekansige waardes onafhanklik genereer om met die oorspronklike ID ooreen te stem, die karteringstabel te stoor en die toegang tot die karteringstabel streng te beheer.

- Jy kan ook enkripsie gebruik om skuilname te produseer, maar moet die dekripsiesleutel behoorlik hou;

Hierdie tegnologie word wyd gebruik in die geval van 'n groot aantal onafhanklike datagebruikers, soos OpenID in die oop platform scenario, waar verskillende ontwikkelaars verskillende Openids vir dieselfde gebruiker verkry.

(5).Veralgemeningstegnieke

Veralgemeningstegniek verwys na 'n de-identifikasietegniek wat die korreligheid van geselekteerde eienskappe in 'n datastel verminder en 'n meer algemene en abstrakte beskrywing van die data verskaf.Veralgemeningstegnologie is maklik om te implementeer en kan die egtheid van rekordvlakdata beskerm.Dit word algemeen gebruik in dataprodukte of dataverslae.

- Afronding: behels die keuse van 'n afrondingsbasis vir die geselekteerde kenmerk, soos opwaartse of afwaartse forensiese ondersoeke, wat resultate 100, 500, 1K en 10K lewer

- Boonste en onderste koderingstegnieke: Vervang waardes bo (of onder) die drempel met 'n drempel wat die boonste (of onderste) vlak verteenwoordig, wat 'n resultaat van "bo X" of "onder X" lewer

(6).Randomisering tegnieke

As 'n soort de-identifikasie tegniek verwys ewekansige tegnologie na die wysiging van die waarde van 'n eienskap deur ewekansigheid, sodat die waarde na ewekansigheid verskil van die oorspronklike werklike waarde.Hierdie proses verminder die vermoë van 'n aanvaller om 'n kenmerkwaarde van ander kenmerkwaardes in dieselfde datarekord af te lei, maar beïnvloed die egtheid van die resulterende data, wat algemeen is met produksietoetsdata.


Postyd: 27 September 2022