Kāda ir datu maskēšanas tehnoloģija un risinājums tīkla pakešu brokerī?

1. Datu maskēšanas koncepcija

Datu maskēšana ir pazīstama arī kā datu maskēšana. Tā ir tehniska metode, lai konvertētu, modificētu vai aizsegtu sensitīvus datus, piemēram, mobilā tālruņa numuru, bankas kartes numuru un citu informāciju, ja esam noteikuši maskēšanas noteikumus un politikas. Šī metode galvenokārt tiek izmantota, lai novērstu sensitīvu datu tiešu izmantošanu neuzticamā vidē.

Datu maskēšanas princips: datu maskēšanai ir jāsaglabā sākotnējās datu īpašības, biznesa noteikumi un datu atbilstība, lai nodrošinātu, ka turpmākā izstrāde, testēšana un datu analīze netiks ietekmēta ar maskēšanu. Pirms un pēc maskēšanas jānodrošina datu konsekvence un derīgums.

2. Datu maskēšanas klasifikācija

Datu maskēšanu var iedalīt statiskajā datu maskēšanā (SDM) un dinamiskajā datu maskēšanā (DDM).

Statiskā datu maskēšana (SDM)Statiskai datu maskēšanai ir jāizveido jauna neražošanas vides datubāze, lai to izolētu no ražošanas vides. Sensitīvi dati tiek iegūti no ražošanas datubāzes un pēc tam glabāti neražošanas datubāzē. Tādā veidā desensitizētie dati tiek izolēti no ražošanas vides, kas atbilst biznesa vajadzībām un nodrošina ražošanas datu drošību.

SDM

Dinamiskā datu maskēšana (DDM)To parasti izmanto ražošanas vidē, lai reāllaikā desensitizētu sensitīvus datus. Dažreiz, lai dažādās situācijās nolasītu vienus un tos pašus sensitīvos datus, ir nepieciešami dažādi maskēšanas līmeņi. Piemēram, dažādas lomas un atļaujas var ieviest dažādas maskēšanas shēmas.

DDM

Datu ziņošanas un datu produktu maskēšanas lietojumprogramma

Šādi scenāriji galvenokārt ietver iekšējās datu uzraudzības produktus vai reklāmas stendus, ārējo pakalpojumu datu produktus un ziņojumus, kuru pamatā ir datu analīze, piemēram, biznesa ziņojumus un projektu pārskatus.

datu ziņošanas produktu maskēšana

3. Datu maskēšanas risinājums

Izplatītākās datu maskēšanas shēmas ietver: anulēšanu, nejaušu vērtību, datu aizstāšanu, simetrisku šifrēšanu, vidējo vērtību, nobīdi un noapaļošanu utt.

AnulēšanaNederīgums attiecas uz sensitīvu datu šifrēšanu, saīsināšanu vai slēpšanu. Šī shēma parasti aizstāj reālus datus ar īpašiem simboliem (piemēram, *). Darbība ir vienkārša, taču lietotāji nevar zināt sākotnējo datu formātu, kas var ietekmēt turpmākās datu lietojumprogrammas.

Nejauša vērtībaNejauša vērtība attiecas uz sensitīvu datu nejaušu aizstāšanu (cipari aizstāj ciparus, burti aizstāj burtus un rakstzīmes aizstāj rakstzīmes). Šī maskēšanas metode zināmā mērā nodrošinās sensitīvu datu formātu un atvieglos turpmāku datu lietošanu. Dažiem nozīmīgiem vārdiem, piemēram, cilvēku un vietu nosaukumiem, var būt nepieciešamas maskēšanas vārdnīcas.

Datu aizstāšanaDatu aizstāšana ir līdzīga nulles un nejaušu vērtību maskēšanai, izņemot to, ka maskējošie dati tiek aizstāti ar noteiktu vērtību, nevis izmantojot īpašas rakstzīmes vai nejaušas vērtības.

Simetriskā šifrēšanaSimetriskā šifrēšana ir īpaša atgriezeniska maskēšanas metode. Tā šifrē sensitīvus datus, izmantojot šifrēšanas atslēgas un algoritmus. Šifrteksta formāts atbilst sākotnējiem datiem loģiskajos noteikumos.

VidējiVidējo vērtību shēma bieži tiek izmantota statistikas scenārijos. Skaitliskiem datiem mēs vispirms aprēķinām to vidējo vērtību un pēc tam nejauši sadalām desensibilizētās vērtības ap vidējo vērtību, tādējādi saglabājot datu summu nemainīgu.

Nobīde un noapaļošanaŠī metode maina digitālos datus ar nejaušu nobīdi. Noapaļošana ar nobīdi nodrošina diapazona aptuveno autentiskumu, vienlaikus saglabājot datu drošību, kas ir tuvāki reālajiem datiem nekā iepriekšējās shēmas, un tai ir liela nozīme lielo datu analīzes scenārijā.

ML-NPB-5660-数据脱敏

Ieteicamais modelis "ML-NPB-5660"datu maskēšanai"

4. Bieži izmantotās datu maskēšanas metodes

(1). Statistikas metodes

Datu izlase un datu apkopošana

- Datu izlase: Sākotnējā datu kopuma analīze un novērtēšana, atlasot reprezentatīvu datu kopas apakškopu, ir svarīga metode, lai uzlabotu anonimizācijas metožu efektivitāti.

- Datu apkopošana: kā statistisko metožu (piemēram, summēšanas, skaitīšanas, vidējās vērtības noteikšanas, maksimālās un minimālās vērtības) kopums, ko piemēro mikrodatu atribūtiem, rezultāts ir reprezentatīvs visiem ierakstiem sākotnējā datu kopā.

(2). Kriptogrāfija

Kriptogrāfija ir izplatīta metode, lai mazinātu sensibilizāciju vai uzlabotu tās efektivitāti. Dažādi šifrēšanas algoritmu veidi var panākt atšķirīgus desensibilizācijas efektus.

- Deterministiskā šifrēšana: simetriska šifrēšana, kas nav nejauša. Tā parasti apstrādā identifikācijas datus un var atšifrēt un atjaunot šifrēto tekstu sākotnējā identifikatorā, ja nepieciešams, taču atslēga ir pienācīgi jāaizsargā.

- Neatgriezeniska šifrēšana: jaucējfunkcija tiek izmantota datu apstrādei, ko parasti izmanto identifikācijas datiem. To nevar tieši atšifrēt, un kartēšanas attiecības ir jāsaglabā. Turklāt jaucējfunkcijas īpatnību dēļ var rasties datu sadursmes.

- Homomorfā šifrēšana: tiek izmantots šifrteksta homomorfais algoritms. Tā īpatnība ir tāda, ka šifrteksta operācijas rezultāts pēc atšifrēšanas ir tāds pats kā vienkārša teksta operācijas rezultāts. Tāpēc to parasti izmanto skaitlisku lauku apstrādei, taču veiktspējas apsvērumu dēļ tas netiek plaši izmantots.

(3). Sistēmas tehnoloģija

Slāpēšanas tehnoloģija dzēš vai aizsargā datu vienības, kas neatbilst privātuma aizsardzības prasībām, bet tās nepublicē.

- Maskēšana: tā attiecas uz visizplatītāko desensibilizācijas metodi, lai maskētu atribūta vērtību, piemēram, pretinieka numurs, personas apliecība tiek atzīmēta ar zvaigznīti vai adrese tiek saīsināta.

- Lokāla slāpēšana: attiecas uz noteiktu atribūtu vērtību (kolonnu) dzēšanas procesu, noņemot nebūtiskus datu laukus;

- Ierakstu slāpēšana: attiecas uz konkrētu ierakstu (rindu) dzēšanas procesu, dzēšot nebūtiskus datu ierakstus.

(4). Pseidonīmu tehnoloģija

Pseidonīmu izmantošana ir anonimizācijas metode, kurā tieša identifikatora (vai cita sensitīva identifikatora) vietā tiek izmantots pseidonīms. Pseidonīmu metodes katram atsevišķam informācijas subjektam izveido unikālus identifikatorus tiešu vai sensitīvu identifikatoru vietā.

- Tas var neatkarīgi ģenerēt nejaušas vērtības, lai tās atbilstu sākotnējam ID, saglabāt kartēšanas tabulu un stingri kontrolēt piekļuvi kartēšanas tabulai.

- Šifrēšanu var izmantot arī pseidonīmu ģenerēšanai, taču atšifrēšanas atslēga ir jāglabā pareizi;

Šī tehnoloģija tiek plaši izmantota liela skaita neatkarīgu datu lietotāju gadījumā, piemēram, OpenID atvērtās platformas scenārijā, kur dažādi izstrādātāji iegūst dažādus OpenID vienam un tam pašam lietotājam.

(5). Vispārināšanas metodes

Vispārināšanas metode attiecas uz anonimizācijas metodi, kas samazina atlasīto atribūtu granularitāti datu kopā un sniedz vispārīgāku un abstraktāku datu aprakstu. Vispārināšanas tehnoloģiju ir viegli ieviest, un tā var aizsargāt ierakstu līmeņa datu autentiskumu. To parasti izmanto datu produktos vai datu pārskatos.

- Noapaļošana: ietver noapaļošanas bāzes izvēli atlasītajam atribūtam, piemēram, uz augšu vai uz leju vērstu forenziku, iegūstot rezultātus 100, 500, 1K un 10K.

- Augšējās un apakšējās kodēšanas metodes: aizstājiet vērtības virs (vai zem) sliekšņa ar slieksni, kas attēlo augšējo (vai apakšējo) līmeni, iegūstot rezultātu "virs X" vai "zem X".

(6). Nejaušas atlases metodes

Kā sava veida anonimizācijas metode, nejaušināšanas tehnoloģija attiecas uz atribūta vērtības modificēšanu, izmantojot nejaušināšanu, lai vērtība pēc nejaušināšanas atšķirtos no sākotnējās reālās vērtības. Šis process samazina uzbrucēja spēju iegūt atribūta vērtību no citām atribūtu vērtībām tajā pašā datu ierakstā, bet ietekmē iegūto datu autentiskumu, kas ir raksturīgi ražošanas testu datiem.


Publicēšanas laiks: 2022. gada 27. septembris