• Kitzanos

Il valore dei dati: quando il "cosa" è più importante del "perché".


Ciò che accade in rete non è quasi mai frutto del caso.

Infatti, se Amazon è in grado conoscere in anticipo il prossimo libro che compreremo, se Google è capace di segnalarci sempre il sito più pertinente, se LinkedIn è in grado di mappare il nostro sistema di relazioni professionali e Facebook di mostrarci solo le cose che più ci piacciono lasciandoci immersi nella nostra bolla conoscitiva, non è per via di una qualche fortuita e imponderabile coincidenza astrale. Tutto questo è possibile principalmente grazie ai Big Data e ad evoluti sistemi di intelligenza artificiale.

I Big data, infatti, hanno a che fare con le previsioni e aiutano le organizzazioni a prevedere cosa succederà nel loro ecosistema. E le previsioni, soprattutto se supportate dall'analisi una ingente mole di dati, permettono non solo di avere delle analisi descrittive puntuali sul presente, ma anche di avere delle informazioni attendibili su quanto potrebbe accadere in futuro e quindi di immaginare in anticipo soluzioni ed interventi riguardo a opportunità e/o problematiche che ancora non si sono presentate.

In tutto questo, le correlazioni giocano un ruolo di fondamentale importanza. Un esempio può senza dubbio aiutarci a capire.

Walmart, una delle più grandi catene di distribuzione al mondo, con oltre 450 miliardi di fatturato l'anno, ha utilizzato dati molto diversi tra loro e all’apparenza non correlabili: la vendita di merendine e le notizie sull'arrivo di uragani e grandi temporali. Analizzando la serie storica dei dati a propria disposizione, Wallmart ha scoperto che durante le giornate che precedono gli uragani e i grandi acquazzoni uno dei prodotti più acquistati sono le merendine dolci. Ha correlato i dati, ha messo le merendine vicino al cesto delle torce elettriche e il fatturato è salito.

In maniera analoga la startup americana Zestfinance analizza le nostre fotografie su Instagram indagando sulle nostre abitudini alimentari e sul nostro stile di vita. La sua tecnologia aiuta gli istituti di credito e le assicurazioni a decidere se offrire crediti o assicurare il cliente in base  al quadro che emerge dalle foto del cliente: mangia del cibo sano o meno, fa una vita regolare, beve alcolici, fuma, pratica sport... D'altronde, l’aspettativa di vita (che può essere valutata in funzione delle nostre abitudini quotidiane e dagli scatti della nostra intimità condivisi in rete) può senza dubbio rappresentare un buon parametro per finanziare/assicurare o meno un cliente.

Per comprendere meglio quanto sta accadendo e la portata del cambiamento davanti a cui ci troviamo è importante chiarire che le correlazioni di cui parliamo e le analisi big data ci dicono il "cosa" e ma non sono in grado di spiegare il "perchè".

Tuttavia, come abbiamo visto, sapere il "cosa" spesso è più che sufficiente.

La sostituzione delle dinamiche di analisi connesse ai principi di nesso causale, tipiche delle intelligenze biologiche, a favore di uno schema di correlazione “libero” da vincoli causali nella composizione della base dati, tipico delle intelligenze sintetiche, ha permesso di rilevare nelle serie di dati analizzate pattern e schemi ricorrenti del tutto inaspettati. Questo tipo di analisi pertanto non è tanto volta a spiegare “il perché” qualcosa accada, come avveniva in passato con i tradizionali sistemi di analisi, quanto più a descrivere “il cosa” accade, mettendo in correlazione data point apparentemente irrilevanti per l’indagine e privi di attinenza l’uno con l’altro.

Un caso emblematico ci è fornito ad esempio dal mercato delle auto usate negli Stati Uniti. Una celebre società del settore ha analizzato centinaia di migliaia di dati dati su veicoli di seconda mano e sull’insorgenza di problemi post vendita. Ciò che viene fuori da questa ricerca è che i veicoli arancioni sono meno soggetti a problematiche post vendita rispetto a tutti gli altri veicoli con colorazioni differenti (ben il 50% in meno). Quale sia la causa di questo non ci è possibile saperlo e qualsiasi ipotesi legata ad un approccio causale non sarebbe stata probabilmente capace in fase preanalisi di immaginare che il colore della vettura avesse un peso così rilevante nella valutazione di quale veicolo acquistare.

A ulteriore conforto di quanto i risultati prodotti dalle analisi Big Data possano sconvolgere di fatto le nostre capacità predittive e ribaltare le nostre convinzioni a priori è doveroso citare il caso della Dott.ssa Mc Gregor in Ontario. La Mc Gregor ha scoperto, attraverso l’analisi dei dati raccolti sui bimbi prematuri monitorati dalle macchine nel proprio reparto, qualcosa di sconvolgente e inaspettato, qualcosa che va contro la logica convenzionale abitualmente adoperata dai medici: la stabilizzazione dei parametri nei prematuri generalmente prelude l’insorgere di una grave infezione, come fosse una sorta di quiete prima della tempesta. La Dott.ssa Mc Gregor e la sua equipe hanno scoperto in sostanza che quei segnali, che umanamente gli avrebbero portati ad abbassare la guardia, confortati per l’appunto dalla stabilizzazione dei parametri vitali del neonato, rappresentavano di contro, nei fatti, il momento di massimo allerta.    

Attraverso i Big Data, inoltre, Il valore dei dati si sposta dal loro utilizzo considerato primario (la ragione iniziale per cui sono stati raccolti) ai loro utilizzi futuri. In poche parole mentre prima i dati erano considerati funzionali alla gestione dell'impresa nell'era dei big data tutti i dati sono da considerarsi preziosi in sé e per sé.

Quando parliamo di dati ci riferiamo a tutti i dati anche quelli grezzi e banali (ad esempio il sensore termico macchina industriale). Ciò che differenzia la nostra epoca è che enormi quantità di dati possono essere raccolti con il minimo dispendio economico e con il minimo sforzo da parte di chi li fornisce, spesso anche a sua insaputa. Inoltre, dato l'abbattimento dei costi di archiviazione, e visti gli incalcolabili e spesso imponderabili vantaggi offerti dalle analisi sui big data, da un punto di vista economico è più facile giustificare una loro conservazione piuttosto che una loro eliminazione. I dati, spesso, come abbiamo detto,  raccolti per il loro utilizzo primario nei processi amministrativi e produttivi di una azienda (utilizzo che ne giustifica inizialmente la raccolta), al contrario dei prodotti derivanti dalle attività primarie di produzione di beni e servizi, questi ultimi hanno un valore che non si esaurisce con il loro utilizzo o il loro trasferimento, ma possono essere costantemente riprocessati con scopi differenti continuando a produrre e quindi a rappresentare valore. Al contrario dei beni materiali, le informazioni non si logorano.

Questo, in poche parole, significa che le aziende possono sfruttare efficacemente a proprio vantaggio i dati anche se il loro utilizzo primario, o ciascuno degli utilizzi successivi, apporta un valore marginale, semplicemente utilizzandoli per innumerevoli volte.

Un esempio di quanto enunciato sono le queries dei motori di ricerca, basti pensare  che, non solo i colossi tecnologici, ma anche la Banca di Inghilterra usa ad esempio le queries relative ai beni immobili per fare analisi predittiva e capire se i prezzi degli immobili saliranno o scenderanno.

Bisogna comprendere infatti che il valore di riutilizzo dei dati è di importanza capitale, non solo per le società tecnologiche e per quelle che lavorano principalmente online, ma anche e soprattutto per le aziende che lavorano offline.

Queste società, che spesso raccolgono un diluvio di dati di ogni genere e tipo, solamente per i loro scopi primari di produzione e che conservano questi dati semplicemente per via dei bassi costi di archiviazione, potrebbero di fatto sedere su una miniera d'oro senza essersene mai rese conto. Ad esempio, Mckinsey & Company in uno studio del 2012 porta l'esempio di una azienda di logistica (senza citarne il nome) che, attraverso il processo di consegna delle merci aveva nel corso degli anni raccolto casualmente ed inconsapevolmente una enorme mole di informazioni sulle spedizioni di prodotti in tutto il globo. Questa azienda, approfondendo le opportunità offerte dai Big Data, ha fiutato l'opportunità costituendo una apposita unit aziendale per la vendita dei dati aggregati sotto forma di previsioni economico finanziarie, diventando in parte l'equivalente off line del servizio di google relativo all'analisi delle queries pregresse.

Alcune imprese, infatti, proprio in virtù della posizione che occupano nella catena di valore, potrebbero raccogliere enormi quantità di dati, anche se non sembrano averne bisogno immediato o non hanno ancora evoluto una certa expertise nel loro riutilizzo. La cosa fondamentale da comprendere in questo processo è che il valore dei dati non risiede nel valore dei singoli data point, ma da ciò che i suddetti data point sono in grado di rivelare nel proprio insieme.

Anche nella gestione dei dati, come affermava Aristotele, il tutto è sempre superiore alla somma delle singole parti, per cui quando ricombiniamo due o più database quel totale varrà più della somma dei singoli addendi. Alla luce di questa affermazione, viene da sé che l'oligopolio sulla proprietà dei dati in cui è immersa la nostra società non solo possa dimostrarsi (e di fatto lo è) lesivo e pericoloso rispetto alla nostra libertà individuale, ma che possa portare ad un impoverimento della nostra società, non solo limitando (come accade) l'accesso, ma impedendo di fatto ai dati di esprimere tutto il loro potenziale, privando in questo modo la collettività del loro reale valore. 

In termini complessivi, tanto per i cittadini quanto per il regolatore, la distribuzione della proprietà dei dati, la loro portabilità, accessibilità e condivisione non possono che rappresentare la via più auspicabile per il futuro e l'obbiettivo più importante da raggiungere già nel breve e medio termine (il GDPR va per l'appunto in questa direzione).

Solo in questo modo potremo permettere ai dati di divenire un valore per la collettività, liberandoli, garantendo a tutti eguale accesso alle informazioni, permettendo ai dati di "parlare" a ciascuno di noi  e non più, come accade oggi, di bisbigliare nelle orecchie di pochi.

0 visualizzazioni

Kitzanos Soc. Coop. 

Piazza Martiri, 12

09124 Cagliari

__________________________________

Mail: info@kitzanos.com

Phone: +39  

___________________________

 

P.IVA: 03748590928

Capitale sociale: € 3.000 i.v.

Link utili

Downloads

> Press Kit

Seguici sui social

  • Facebook - Bianco Circle
  • Twitter - Bianco Circle
  • LinkedIn - Bianco Circle
  • Instagram - Bianco Circle

All rights reserved©2019 Kitzanos Soc. Coop.