Quali sono i dati sensibili da non pubblicare?

Dati pubblicati e dati non pubblicati

In un documento che accompagna il rilascio dei dati, i ricercatori hanno semplicemente dichiarato: “Alcuni potrebbero obiettare sull’etica della raccolta e del rilascio di questi dati. Tuttavia, tutti i dati trovati nel set di dati sono o erano già disponibili al pubblico, quindi il rilascio di questo set di dati lo presenta semplicemente in una forma più utile”.

Questo ha causato un’enorme controversia perché le persone potevano essere effettivamente identificate; non avevano acconsentito a far parte di questa ricerca quando si sono iscritti al sito; e OKCupid non aveva chiesto il permesso. Il set di dati è stato cancellato.

Dobbiamo distinguere tra dati personali e sensibili. Secondo il Data Protection Act 1998, i dati sensibili possono includere informazioni sulla razza, l’origine etnica, l’opinione politica, le convinzioni religiose o simili, la salute, la vita sessuale, i reati (presunti) e i procedimenti giudiziari, l’appartenenza sindacale e così via. Questi dati in sé non sono problematici e possono essere condivisi.

Ma i problemi sorgono quando lo stesso set di dati contiene informazioni che potrebbero identificare a quali individui questi dati si riferiscono. I dati personali includono registrazioni o altre informazioni che da sole o collegate ad altri dati o informazioni possono rivelare l’identità di una persona vivente.

Principi equi

AbstractLa conservazione della privacy nella pubblicazione dei dati è la preoccupazione principale al giorno d’oggi, perché i dati pubblicati attraverso internet sono aumentati di giorno in giorno. Questa enorme quantità di dati è stata chiamata Big Data per le sue dimensioni. Questo progetto si occupa della conservazione della privacy nel contesto dei big data utilizzando una soluzione di data warehousing chiamata hive. Abbiamo implementato il clustering basato sulla somiglianza più vicina (NSB) con la generalizzazione Bottom-up per ottenere l’anonimato (v,l) che si occupa delle vulnerabilità della sensibilità e garantisce la privacy individuale. Abbiamo anche calcolato i livelli di sensibilità con un semplice metodo di confronto utilizzando i valori dell’indice, classificando i diversi livelli di sensibilità. Gli esperimenti sono stati effettuati sull’ambiente hive per verificare l’efficienza degli algoritmi con grandi dati. Questo framework supporta anche l’esecuzione di algoritmi esistenti senza alcuna modifica. Il modello nell’articolo supera i modelli esistenti.

  Come si scrive tre ore e mezza?

Come mostrato in Fig. 1 il processo complessivo consiste in 5 fasi. Nella prima fase i microdati saranno presi come input. Nella seconda fase i livelli di sensibilità saranno calcolati e aggiornati nella tabella dei microdati. La generalizzazione bottom-up sarà eseguita su questa tabella aggiornata nella fase 3. Poi la condizione di anonimato (v, l) sarà controllata in ogni classe di equivalenza nella fase successiva. Se la condizione è soddisfatta, allora i dati resi anonimi saranno pubblicati, altrimenti la tabella va di nuovo sotto processo di generalizzazione per il livello successivo e di nuovo la condizione di anonimato sarà controllata e i dati resi anonimi saranno pubblicati.Fig. 1Processo complessivo di conservazione della privacyImmagine completa

Esempio di dati pubblicati

Lo scopo di questa linea guida è quello di stabilire un quadro per classificare i dati istituzionali in base al loro livello di sensibilità, valore e criticità per l’Università, come richiesto dalla politica di sicurezza delle informazioni dell’Università. La classificazione dei dati aiuterà a determinare i controlli di sicurezza di base per la protezione dei dati.

  Quali sono i dati sensibili di una persona?

Questa politica si applica a tutti i docenti, al personale e agli agenti terzi dell’Università, nonché a qualsiasi altro affiliato dell’Università che sia autorizzato ad accedere ai dati istituzionali. In particolare, questa linea guida si applica a coloro che sono responsabili della classificazione e della protezione dei Dati Istituzionali, come definito dai Ruoli e dalle Responsabilità della Sicurezza delle Informazioni.

Dati confidenziali è un termine generico che rappresenta tipicamente i dati classificati come limitati, secondo lo schema di classificazione dei dati definito in questa linea guida. Questo termine è spesso usato in modo intercambiabile con dati sensibili.

Un Data Steward è un dipendente di alto livello dell’Università che supervisiona il ciclo di vita di uno o più set di dati istituzionali. Vedere i Ruoli e le Responsabilità della sicurezza delle informazioni per ulteriori informazioni.

Cosa sono i dati pubblicati

Potresti ancora essere in grado di pubblicare dati che contengono informazioni sensibili, tuttavia è necessario adottare misure supplementari per precauzione, come la deidentificazione dei dati e l’impostazione delle condizioni di accesso in modo che sia necessaria l’approvazione prima che altri possano accedere ai dati pubblicati.

Capire se si hanno i diritti di pubblicazione dei dati di ricerca può essere fonte di confusione. Il personale e gli studenti dell’Università di Sydney dovrebbero consultare la Politica sulla proprietà intellettuale 2016. A seconda delle circostanze di come è stata condotta la tua ricerca, potrebbero esserci altre cose da considerare. Alcune situazioni comuni in cui potrebbe essere necessaria un’ulteriore considerazione sono:

  Che scuola superiore devo fare per laurea in criminologia?

Se hai usato dati raccolti da qualcun altro o da un’organizzazione, come l’Australian Bureau of Statistics o il Department of Health, dovrai controllare quali sono i tuoi diritti sui dati. Se i dati sono disponibili al pubblico, controllare sotto quale licenza sono stati pubblicati aiuterà a determinare se potete rendere disponibile il vostro set di dati. Se hai stipulato un accordo per l’accesso e l’uso dei dati, controlla l’accordo per vedere quali termini esistono riguardo alla pubblicazione di dati derivati dal dataset originale. Se non sei sicuro, contatta il raccoglitore originale dei dati o contatta ses.admin@sydney.edu.au per assistenza.

Quali sono i dati sensibili da non pubblicare?
Torna su