EntiOnLine
Categorie
indietro
10/02/2020 BIG DATA - Profilazione, anonimizzazione del dato e algoritmi
Il documento è riservato agli abbonati

Per qualsiasi informazione inerente i prezzi o le modalità di effettuazione del servizio, contatta l'agente di zona oppure scrivi a info@entionline.it
o telefona allo 030/2531939.

Principali considerazioni sulla gestione dei Big Data espresse dai soggetti partecipanti - Profilazione, anonimizzazione del dato e algoritmi

Le società che hanno partecipato alle audizioni hanno ripetutamente evidenziato che il valore dei Big Data non risiede tanto nella diponibilità di una mole di dati, bensì nella loro qualità. I dati, infatti, una volta organizzati ed elaborati, assumono grande rilievo in relazione alle informazioni che sono in grado di fornire e che possono essere utilizzate per scopi commerciali, sociali o politici. I possessori di tali dati possono, ad esempio, estrarre da essi trend di consumo e di comportamento dei singoli soggetti, ottenendo una serie di informazioni finalizzate ad orientare e/o adattare, rispetto ai gusti e alle preferenze espresse dai propri utenti/clienti, le scelte commerciali; con le informazioni così ottenute, è possibile perfino determinare le preferenze preventivamente. La funzione predittiva della profilazione, volta ad anticipare i bisogni degli individui, avviene ricorrendo a tecniche di organizzazione e modellizzazione dei dati raccolti, con l’obiettivo di incidere sulle scelte dei singoli individui, adattandole alla realtà che si vive in un determinato periodo di tempo. Quindi, per valorizzare i dati in possesso, di prassi si ricorre alla profilazione, intesa come l’insieme delle attività di raccolta e di elaborazione dei dati inerenti agli utenti fruitori di un servizio, al fine di segmentarli in gruppi a seconda del comportamento rilevato.

Da tale prospettiva deriva che, come evidenziato durante le audizioni, nell’ambito delle attività di profilazione, finalizzate ad orientare o a determinare preventivamente le scelte di business, la conoscenza dell’identità personale dell’utente spesso è marginale rispetto alle informazioni possedute del retailer (o da altro soggetto portatore di interessi specifici) e opportunamente elaborate tramite l’utilizzo di algoritmi. In alcuni interventi è stato evidenziato che i soggetti che posseggono una mole di dati sono prevalentemente interessati a conoscere gli usi, i costumi e le preferenze degli utenti/clienti, al fine di tracciare e di definire i c.d. “tipi-ideali”, ossia una serie di individui-modello in grado di rappresentare le caratteristiche tipiche di migliaia di persone che, rientrando per le loro peculiarità in quel determinato profilo, realizzeranno con alta probabilità le scelte effettuate dal c.d. “tipo-ideale”.

Dall’indagine è chiaramente emerso che colui che ricorre a un’attività di profilazione utilizza, tendenzialmente, dati anonimizzati (profilo sul quale si tornerà al par. 4.8), in quanto riesce a ottenere comunque le informazioni di cui necessita al fine di pianificare le proprie strategie di mercato, oltre a non violare la normativa sulla protezione dei dati personali. Le informazioni sull’identità personale di un utente/cliente, pertanto, sembrerebbero avere meno attrattiva, rispetto alla conoscenza sulle caratterizzazioni dei “tipi ideali”, sebbene sia stato empiricamente dimostrato come, a determinate condizioni, sia tecnicamente possibile scoprire l’identità di una persona partendo dai dati generici o da metadati (ad esempio gli orari e i luoghi in cui vengono effettuate letelefonate tra due numerazioni).

Da quanto dichiarato dagli operatori di mercato sembrerebbe che, nell’ambito dei processi aziendali, si proceda con l’implementare politiche volte a standardizzare procedure di anonimizzazione dei dati di identità personale. Tuttavia, come evidenziato più volte in audizione, in presenza di dati anonimizzati è possibile, incrociando una serie di data base e organizzando e correlando una mole di dati, non solo individuare circostanziati target al fine di creare specifiche categorie sulla base dei differenti identikit emersi, ma addirittura risalire all’identità del soggetto.

Nelle audizioni è stato rappresentato l’importante ruolo svolto dagli analisti informatici, c.d. “data scientist”, soprattutto in relazione al complesso compito della costruzione degli algoritmi, indispensabili per ottenere dai dati accumulati le informazioni desiderate. Nell’agire quotidiano ogni individuo lascia tracce di dati che raccolti, memorizzati ed organizzati consentono, grazie all’intelligenza degli algoritmi, elaborati dai data scientist, di definire correlazioni tra persone, prodotti e servizi. Le “informazioni desiderate”, infatti, in considerazione della vastità dei dati disponibili, della varietà della loro struttura (in termini di contenuto e di formati), nonché della velocità di aggiornamento dei medesimi, risultano essere occultate, tra le infinite correlazioni spurie dei dati raccolti, e come tali devono essere “catturate” per portarle alla luce.

Alcuni esperti, nelle audizioni, hanno specificato che l’analisi effettuata sui Big Data può avvenire tramite due tipologiedi algoritmi: 1) gli algoritmi analytics, che organizzano le informazioni in modo che sia possibile, a certe condizioni, anticipare le scelte, di acquisto o di voto delle persone, determinandone almeno in parte i comportamenti; 2) gli algoritmi di machine learning, abilitano un apprendimento automatico da parte di un sistema informatico, rafforzandone e sviluppandone significativamente le capacità di interazioni complesse. Con gli algoritmi di apprendimento la macchina, man mano che fa esperienza, diventa sempre più autonoma e in grado di fornire informazioni sempre più precise.

Nel corso delle audizioni è stato altresì sottolineato che l’uso degli algoritmi finalizzato a pratiche di price discrimination potrebbe condurre ad una revisione di alcuni modelli e istituti giuridici inerenti all’autonomia contrattuale delle parti negoziali, che sembrano entrare in crisi nel contesto delle pratiche basate sul profiling. Ad esempio, nella decisione di comprare e/o vendere beni e di trattare sui prezzi, il legislatore o il giudice, salvo eccezioni, non analizzala dinamica inerente ai profili economici dell’accordo. Tuttavia, ove il prezzo sia “deciso” da una macchina, in base all’analisi del profilo individuale o di gruppo, dal punto di vista giuridico la situazione cambia radicalmente, essendo il costo del bene determinato non sulla base di “trattative”, bensì in ragione di una classificazione attribuita da un algoritmo, che sfrutta le propensioni individuali e che non è nota all’interessato.

Inoltre, è stato evidenziato che le imprese, attraverso gli algoritmi, non solo determinano i prezzi, ma possono anche “aggiustarli” in modo dinamico sulla base delle costanti analisi effettuate da programmi informatici. In definitiva, la disponibilità di grandi lotti di dati, elaborati attraverso gli algoritmi, consente una valorizzazione diretta del patrimonio informativo. Come noto, il prezzo di un prodotto/servizio contiene le voci di costo di cui si compone e, in generale, esso, al fine di pianificare le migliori strategie commerciali, viene determinato tramite elaborazioni algoritmiche anche sulla base di una serie di informazioni inerenti ai comportamenti dei clienti (come l’elasticità della domanda al prezzo, le abitudini di consumo, i bisogni consci e inconsci, etc.).

Fonte: Rapporto 2020 AGCOM, AGCM E GARANTE sui Big Data

Banca dati