Kas ir tīkla pakešu brokera datu maskēšanas tehnoloģija un risinājums?

1. Datu maskēšanas jēdziens

Datu maskēšana ir pazīstama arī kā datu maskēšana. Tā ir tehniska metode, lai pārveidotu, pārveidotu vai segtu sensitīvus datus, piemēram, mobilā tālruņa numuru, bankas kartes numuru un citu informāciju, ja esam norādījuši maskēšanas noteikumus un politikas. Šo paņēmienu galvenokārt izmanto, lai novērstu sensitīvu datu tiešu izmantošanu neuzticamā vidē.

Datu maskēšanas princips: datu maskēšanai jāsaglabā sākotnējie datu raksturlielumi, biznesa noteikumi un datu atbilstība, lai nodrošinātu, ka maskēšana neietekmēs turpmāko izstrādi, testēšanu un datu analīzi. Nodrošiniet datu konsekvenci un derīgumu pirms un pēc maskēšanas.

2. Datu maskēšanas klasifikācija

Datu maskēšanu var iedalīt statiskajā datu maskēšanā (SDM) un dinamiskajā datu maskēšanā (DDM).

Statiskā datu maskēšana (SDM): Statiskajai datu maskēšanai ir jāizveido jauna neražošanas vides datu bāze, lai to izolētu no ražošanas vides. Sensitīvie dati tiek iegūti no ražošanas datu bāzes un pēc tam tiek saglabāti datubāzē, kas nav ražošanas datubāze. Tādā veidā desensibilizētie dati tiek izolēti no ražošanas vides, kas atbilst biznesa vajadzībām un nodrošina ražošanas datu drošību.

SDM

Dinamiskā datu maskēšana (DDM): to parasti izmanto ražošanas vidē, lai reāllaikā desensibilizētu sensitīvus datus. Dažreiz ir nepieciešami dažādi maskēšanas līmeņi, lai dažādās situācijās nolasītu vienus un tos pašus sensitīvos datus. Piemēram, dažādas lomas un atļaujas var ieviest dažādas maskēšanas shēmas.

DDM

Datu ziņošanas un datu produktu maskēšanas lietojumprogramma

Šādi scenāriji galvenokārt ietver iekšējos datu uzraudzības produktus vai stendu, ārējo pakalpojumu datu produktus un pārskatus, kas balstīti uz datu analīzi, piemēram, biznesa pārskatus un projektu pārskatus.

datu ziņošanas produktu maskēšana

3. Datu maskēšanas risinājums

Izplatītas datu maskēšanas shēmas ietver: nederīgumu, nejaušu vērtību, datu aizstāšanu, simetrisko šifrēšanu, vidējo vērtību, nobīdi un noapaļošanu utt.

Par spēkā neesošu: nederīgums attiecas uz sensitīvu datu šifrēšanu, saīsināšanu vai slēpšanu. Šī shēma parasti aizvieto reālos datus ar īpašiem simboliem (piemēram, *). Darbība ir vienkārša, taču lietotāji nevar zināt sākotnējo datu formātu, kas var ietekmēt turpmākās datu lietojumprogrammas.

Izlases vērtība: izlases vērtība attiecas uz sensitīvu datu nejaušu aizstāšanu (cipari aizstāj ciparus, burti aizstāj burtus un rakstzīmes aizstāj rakstzīmes). Šī maskēšanas metode zināmā mērā nodrošinās sensitīvu datu formātu un atvieglos turpmāku datu pielietošanu. Dažiem nozīmīgiem vārdiem, piemēram, cilvēku un vietu nosaukumiem, var būt nepieciešamas maskēšanas vārdnīcas.

Datu aizstāšana: datu aizstāšana ir līdzīga nulles un nejaušības vērtību maskēšanai, izņemot to, ka speciālo rakstzīmju vai nejaušības vērtību izmantošanas vietā maskēšanas dati tiek aizstāti ar noteiktu vērtību.

Simetriskā šifrēšana: Simetriskā šifrēšana ir īpaša atgriezeniska maskēšanas metode. Tas šifrē sensitīvus datus, izmantojot šifrēšanas atslēgas un algoritmus. Šifrēta teksta formāts atbilst oriģinālajiem datiem loģiskajos noteikumos.

Vidēji: statistikas scenārijos bieži izmanto vidējo shēmu. Skaitliskajiem datiem mēs vispirms aprēķinām to vidējos rādītājus un pēc tam nejauši sadalām desensibilizētās vērtības ap vidējo, tādējādi saglabājot datu summu nemainīgu.

Nobīde un noapaļošana: šī metode maina digitālos datus ar nejaušas nobīdes palīdzību. Ofseta noapaļošana nodrošina aptuveno diapazona autentiskumu, vienlaikus saglabājot datu drošību, kas ir tuvāk reālajiem datiem nekā iepriekšējās shēmās, un tai ir liela nozīme lielo datu analīzes scenārijā.

ML-NPB-5660-数据脱敏

Ieteiktais modelis"ML-NPB-5660" datu maskēšanai

4. Bieži lietotās datu maskēšanas metodes

(1). Statistikas metodes

Datu izlase un datu apkopošana

- Datu paraugu ņemšana. Sākotnējās datu kopas analīze un novērtēšana, izvēloties reprezentatīvu datu kopas apakškopu, ir svarīga metode, lai uzlabotu deidentifikācijas metožu efektivitāti.

- Datu apkopošana. Tā kā statistikas metožu kopums (piemēram, summēšana, skaitīšana, vidējā noteikšana, maksimālais un minimums), ko izmanto mikrodatu atribūtiem, rezultāts reprezentē visus ierakstus sākotnējā datu kopā.

(2). Kriptogrāfija

Kriptogrāfija ir izplatīta metode desensibilizācijas mazināšanai vai desensibilizācijas efektivitātes uzlabošanai. Dažādu veidu šifrēšanas algoritmi var panākt dažādus desensibilizācijas efektus.

- Deterministiskā šifrēšana: negadījuma simetriska šifrēšana. Tas parasti apstrādā ID datus un vajadzības gadījumā var atšifrēt un atjaunot šifrēto tekstu uz sākotnējo ID, taču atslēga ir pareizi jāaizsargā.

- Neatgriezeniska šifrēšana: datu apstrādei tiek izmantota jaucējfunkcija, ko parasti izmanto ID datiem. To nevar tieši atšifrēt, un kartēšanas attiecības ir jāsaglabā. Turklāt jaucējfunkcijas dēļ var rasties datu sadursme.

- Homomorfā šifrēšana: tiek izmantots šifrētā teksta homomorfiskais algoritms. Tā īpašība ir tāda, ka šifrētā teksta darbības rezultāts ir tāds pats kā vienkārša teksta darbības rezultāts pēc atšifrēšanas. Tāpēc to parasti izmanto skaitlisko lauku apstrādei, taču to plaši neizmanto veiktspējas apsvērumu dēļ.

(3). Sistēmas tehnoloģija

Slēpšanas tehnoloģija dzēš vai aizsargā datu vienumus, kas neatbilst privātuma aizsardzībai, bet tos nepublicē.

- Maskēšana: tas attiecas uz visizplatītāko desensibilizācijas metodi, lai maskētu atribūta vērtību, piemēram, pretinieka numuru, ID karte ir atzīmēta ar zvaigznīti vai adrese ir saīsināta.

- Lokālā slāpēšana: attiecas uz konkrētu atribūtu vērtību (kolonnu) dzēšanas procesu, noņemot nebūtiskus datu laukus;

- Ierakstu bloķēšana: attiecas uz konkrētu ierakstu (rindu) dzēšanas procesu, nebūtisku datu ierakstu dzēšanu.

(4). Pseidonīms Tehnoloģija

Pseidomannings ir deidentifikācijas paņēmiens, kas izmanto pseidonīmu, lai aizstātu tiešo identifikatoru (vai citu sensitīvu identifikatoru). Pseidonīmu metodes katram atsevišķam informācijas subjektam rada unikālus identifikatorus, nevis tiešus vai sensitīvus identifikatorus.

- Tas var neatkarīgi ģenerēt nejaušas vērtības, lai tās atbilstu sākotnējam ID, saglabātu kartēšanas tabulu un stingri kontrolētu piekļuvi kartēšanas tabulai.

- Varat arī izmantot šifrēšanu, lai izveidotu pseidonīmus, taču ir pareizi jāsaglabā atšifrēšanas atslēga;

Šo tehnoloģiju plaši izmanto liela skaita neatkarīgu datu lietotāju gadījumā, piemēram, OpenID atvērtās platformas scenārijā, kur dažādi izstrādātāji vienam un tam pašam lietotājam iegūst dažādus Openid.

(5). Vispārināšanas paņēmieni

Vispārināšanas paņēmiens attiecas uz deidentifikācijas paņēmienu, kas samazina atlasīto atribūtu precizitāti datu kopā un nodrošina vispārīgāku un abstraktāku datu aprakstu. Vispārināšanas tehnoloģiju ir viegli ieviest, un tā var aizsargāt ieraksta līmeņa datu autentiskumu. To parasti izmanto datu produktos vai datu pārskatos.

- Noapaļošana: ietver noapaļošanas bāzes atlasi atlasītajam atribūtam, piemēram, uz augšu vai uz leju kriminālistikas, iegūstot rezultātus 100, 500, 1K un 10K.

- Augšējās un apakšējās kodēšanas metodes: aizstājiet vērtības virs (vai zem) sliekšņa ar slieksni, kas apzīmē augšējo (vai apakšējo) līmeni, iegūstot rezultātu "virs X" vai "zem X".

(6). Randomizācijas metodes

Kā sava veida deidentifikācijas paņēmiens randomizācijas tehnoloģija attiecas uz atribūta vērtības modificēšanu, izmantojot randomizāciju, lai vērtība pēc randomizācijas atšķirtos no sākotnējās reālās vērtības. Šis process samazina uzbrucēja spēju iegūt atribūta vērtību no citām atribūtu vērtībām tajā pašā datu ierakstā, bet ietekmē iegūto datu autentiskumu, kas ir kopīgs ražošanas testa datiem.


Izsūtīšanas laiks: 27. septembris 2022