Wat is die data -maskeringstegnologie en oplossing in netwerkpakketmakelaar?

1. Die konsep van data -maskering

Data -maskering staan ​​ook bekend as data -maskering. Dit is 'n tegniese metode om sensitiewe data soos selfoonnommer, bankkaartnommer en ander inligting om te skakel, te verander of te dek wanneer ons maskeringsreëls en -beleide gegee het. Hierdie tegniek word hoofsaaklik gebruik om te voorkom dat sensitiewe data direk in onbetroubare omgewings gebruik word.

Data -maskerbeginsel: Data -maskering moet die oorspronklike datakarakteristieke, besigheidsreëls en data -relevansie handhaaf om te verseker dat die daaropvolgende ontwikkeling, toetsing en data -analise nie deur maskering beïnvloed sal word nie. Verseker die konsekwentheid en geldigheid van data voor en na maskering.

2. Data -maskering klassifikasie

Data -maskering kan verdeel word in statiese data -maskering (SDM) en dinamiese data -maskering (DDM).

Statiese data -maskering (SDM): Statiese data-maskering vereis dat 'n nuwe databasis vir nie-produksie-omgewing die produksie van die produksie-omgewing moet vestig. Sensitiewe data word uit die produksiedatabasis onttrek en dan in die nie-produksie-databasis gestoor. Op hierdie manier word die desensitiseerde data geïsoleer van die produksie -omgewing, wat aan die behoeftes van die besigheid voldoen en die veiligheid van produksiedata verseker.

SDM

Dinamiese data -maskering (DDM): Dit word gewoonlik in die produksie -omgewing gebruik om sensitiewe data in reële tyd te desensitiseer. Soms is verskillende vlakke van maskering nodig om dieselfde sensitiewe data in verskillende situasies te lees. Byvoorbeeld, verskillende rolle en toestemmings kan verskillende maskeringskemas implementeer.

DDM

Data -verslagdoening en Data Products Maskering -toepassing

Sulke scenario's bevat hoofsaaklik interne datakoniteringsprodukte of advertensiebord, eksterne diensdataprodukte en verslae gebaseer op data -ontleding, soos sakeverslae en projekbeoordeling.

Data -verslagdoening Produkmaskering

3. Data -maskeringsoplossing

Algemene data -maskeringskemas sluit in: ongeldigheid, ewekansige waarde, vervanging van data, simmetriese kodering, gemiddelde waarde, offset en afronding, ens.

Ongeldigheid: Ongeldige verwysing verwys na die kodering, afgeknot of verberg van sensitiewe data. Hierdie skema vervang gewoonlik regte data met spesiale simbole (soos *). Die operasie is eenvoudig, maar gebruikers kan nie die formaat van die oorspronklike data ken nie, wat die daaropvolgende datatoepassings kan beïnvloed.

Willekeurige waarde: Die ewekansige waarde verwys na die ewekansige vervanging van sensitiewe data (getalle vervang syfers, letters vervang letters en karakters vervang karakters). Hierdie maskeringsmetode sal die formaat van sensitiewe data tot 'n sekere mate verseker en die daaropvolgende datatoepassing vergemaklik. Maskerende woordeboeke kan nodig wees vir 'n paar betekenisvolle woorde, soos name van mense en plekke.

Datavervanging: Data -vervanging is soortgelyk aan die maskering van nul- en ewekansige waardes, behalwe dat die maskeringsdata in plaas van spesiale karakters of ewekansige waardes vervang word met 'n spesifieke waarde.

Simmetriese kodering: Simmetriese kodering is 'n spesiale omkeerbare maskeringsmetode. Dit kodering vir sensitiewe data deur koderingsleutels en algoritmes. Die CipherText -formaat stem ooreen met die oorspronklike data in logiese reëls.

Gemiddeld: Die gemiddelde skema word dikwels in statistiese scenario's gebruik. Vir numeriese gegewens bereken ons eers die gemiddelde daarvan, en versprei ons dan die desensitiseerde waardes rondom die gemiddelde willekeurig en hou die som van die data konstant.

Offset en afronding: Hierdie metode verander die digitale data deur ewekansige verskuiwing. Die offset -afronding verseker die benaderde egtheid van die reeks, terwyl die sekuriteit van die data, wat nader aan die werklike data is as die vorige skemas, en 'n groot belang in die scenario van Big Data -analise is.

ML-NPB-5660- 数据脱敏

Die aanbevelingsmodel "ML-NPB-5660"Vir die data -maskering

4. algemeen gebruikte data -maskeringstegnieke

(1). Statistiese tegnieke

Data -steekproefneming en data -aggregasie

- Data-steekproefneming: Die ontleding en evaluering van die oorspronklike datastel deur 'n verteenwoordigende subset van die datastel te kies, is 'n belangrike metode om die effektiwiteit van de-identifikasietegnieke te verbeter.

- Data -samevoeging: As 'n versameling van statistiese tegnieke (soos opsomming, tel, gemiddeld, maksimum en minimum) toegepas word op eienskappe in microdata, is die resultaat verteenwoordigend van alle rekords in die oorspronklike datastel.

(2). Kriptografie

Kryptografie is 'n algemene metode om die effektiwiteit van desensitisering te desensitiseer of te verbeter. Verskillende soorte koderingsalgoritmes kan verskillende desensitiseringseffekte bereik.

- Deterministiese kodering: 'n nie-ewekansige simmetriese kodering. Dit verwerk gewoonlik ID -data en kan die kodes op die oorspronklike ID dekodeer en herstel, maar die sleutel moet behoorlik beskerm word.

- Onomkeerbare kodering: Die hash -funksie word gebruik om data te verwerk, wat gewoonlik vir ID -data gebruik word. Dit kan nie direk ontsyfer word nie en die kartering -verhouding moet gered word. As gevolg van die kenmerk van die hash -funksie, kan databotsing ook voorkom.

- Homomorfe kodering: die koderfiese algoritme word gebruik. Die kenmerk daarvan is dat die resultaat van die kodetekse dieselfde is as dié van gewone teksoperasie na dekripsie. Daarom word dit gereeld gebruik om numeriese velde te verwerk, maar dit word nie wyd gebruik om prestasie -redes nie.

(3). Stelseltegnologie

Die onderdrukkingstegnologie verwyder of beskerm data -items wat nie aan privaatheidsbeskerming voldoen nie, maar dit nie publiseer nie.

- Maskering: Dit verwys na die algemeenste desensitiseringsmetode om die attribuutwaarde te verberg, soos die teenstandernommer, ID -kaart word met 'n asterisk gemerk, of die adres is afgekap.

- Plaaslike onderdrukking: verwys na die proses om spesifieke attribuutwaardes (kolomme) te verwyder, en nie-noodsaaklike datavelde te verwyder;

- Rekordonderdrukking: verwys na die proses om spesifieke rekords (rye) te verwyder, wat nie-noodsaaklike datapekords verwyder.

(4). Skuilnaam tegnologie

Pseudomanning is 'n de-identifikasietegniek wat 'n skuilnaam gebruik om 'n direkte identifiseerder (of ander sensitiewe identifiseerder) te vervang. Pseudonym -tegnieke skep unieke identifiseerders vir elke individuele inligtingsonderwerp, in plaas van direkte of sensitiewe identifiseerders.

- Dit kan onafhanklik ewekansige waardes genereer om ooreenstem met die oorspronklike ID, die karteringstabel te stoor en die toegang tot die karteringstabel streng te beheer.

- U kan ook kodering gebruik om skuilname te produseer, maar moet die dekripsiesleutel behoorlik hou;

Hierdie tegnologie word wyd gebruik in die geval van 'n groot aantal onafhanklike databers, soos OpenID in die Open Platform -scenario, waar verskillende ontwikkelaars verskillende Openids vir dieselfde gebruiker kry.

(5). Veralgemeningstegnieke

Veralgemeningstegniek verwys na 'n de-identifikasietegniek wat die korrelheid van geselekteerde eienskappe in 'n datastel verminder en 'n meer algemene en abstrakte beskrywing van die data bied. Veralgemeningstegnologie is maklik om te implementeer en kan die egtheid van rekordvlak-data beskerm. Dit word gereeld in dataprodukte of dataverslae gebruik.

- Afronding: behels die keuse van 'n afrondingsbasis vir die geselekteerde attribuut, soos opwaartse of afwaartse forensika, wat resultate 100, 500, 1K en 10K lewer

- Boonste en onderkoderingstegnieke: Vervang waardes bo (of onder) die drempel met 'n drempel wat die boonste (of onderste) vlak voorstel, wat 'n resultaat van "bo x" of "onder x" lewer

(6). Randomiseringstegnieke

As 'n soort de-identifikasietegniek, verwys randomiseringstegnologie na die modifisering van die waarde van 'n attribuut deur randomisering, sodat die waarde na randomisering verskil van die oorspronklike reële waarde. Hierdie proses verminder die vermoë van 'n aanvaller om 'n attribuutwaarde van ander attribuutwaardes in dieselfde datapekord af te lei, maar dit beïnvloed die egtheid van die resulterende data, wat algemeen voorkom met produksietoetsdata.


Postyd: Sep-27-2022