Numeri, dati, informazione: una conversazione con Marco Tavecchio.
Mario Draghi nel discorso per la fiducia del 17 febbraio in Senato ha detto che “a partire dal nostro patrimonio umanistico … siamo impegnati a disegnare un percorso educativo … [che aiuti a ] coniugare le competenze scientifiche con quelle umanistiche” e affidato un ministero a forte valenza sociale a Elena Bonetti, ministra che proviene dall’Università Statale di Milano dove insegna matematica.
SkyTG24 propone da tempo la rubrica “I numeri della pandemia”[i] che ha fatto della pandemia un’occasione aperta a tutti per imparare a capire quel che i numeri dicono, anche a chi ha bassa cultura matematica. In questi lunghi mesi è apparso il “contatore sulla campagna vaccinale” che ha reso evidente la differenza tra numero di dosi inoculate e numero di persone vaccinate: un numero in continuo aggiornamento che somma il totale delle persone che hanno completato la vaccinazione e il totale delle persone che dopo la prima dose sono in attesa di richiamo. Capire cosa dice il numero ha richiesto solo la pazienza di fermarsi a ascoltare la descrizione di cosa esprime. Un’ esperienza di ascolto e di allenamento a comprendere quando e come i numeri si trasformano in dati e i dati in informazioni. E di riflettere sul legame tra numeri e democrazia.
Ne parlo con Marco Tavecchio, di cultura informatica, dirigente in un’azienda di TLC, amico di lunga data che ringrazio per la disponibilità. Abbiamo lavorato insieme a Mosca nella seconda metà degli anni Novanta e i colleghi russi gli avevano dato il soprannome di ‘greenpeace’.
D. Ho seguito la rubrica di SkyTG24 e sentito il giornalista sottolineare la necessità di interpretare il dato tenendo conto del legame tra il numero stesso e il giorno della settimana in cui è stato raccolto … così ho ripensato a te che ci parlavi di processo di produzione dei dati nel corso di un breve confronto in un gruppo di lavoro sulle abilità digitali di base … proviamo a approfondire?
R. Sicuramente l’accesso all’informazione permette alle persone di farsi un’opinione e prendere decisioni. Quando eravamo all’oscuro sui numeri dei contagiati la nostra vita non era cambiata. Fra il novembre del 2019 e il febbraio del 2020 avevo capito, da persone che lavoravano negli ospedali, che c’era un eccesso di ricoveri in terapia intensiva legati a strane forme di polmonite o di sintomi non riconducibili a qualcosa di usuale. L’assenza di informazioni e di dati dunque – oltre che di diagnosi, in quel caso – ci ha fatto sottovalutare un fenomeno che è diventato quello che tutti sappiamo. L’accesso alle informazioni ci permette di capire cosa sta accadendo intorno a noi, di strutturare un’analisi e di prendere delle decisioni a livello personale, di azienda, di stato. Quindi informazione per me è democrazia … l’accesso alle informazioni più che al dato.
Dico questo perché il dato può essere una cosa anche complessa e se non viene aiutato da un’elaborazione anche sull’asse dei tempi o nel capire le fonti, da un dato puoi non arrivare a una informazione o addirittura giungere a una controinformazione.
D. Un aiuto a capire meglio, un esempio?
R. Faccio un esempio a partire dall’esperienza aziendale. Se vendi un servizio al pubblico una cosa che vuoi sapere è quanti clienti hai, e già dietro questa domanda ce ne sono tante altre. Quanti clienti ho, in che senso? quanti sono gli abbonati adesso? … o quelli che si sono abbonati meno quelli che hanno disdetto? … oppure quanti si sono abbonati nell’ultimo giorno, settimana o mese, il che fa grande differenza. Infatti se metto i numeri sull’asse dei tempi mi accorgerò che i miei abbonati stanno decrescendo oppure aumentando nell’unità di tempo … il che ti dà un’informazione sull’appetibilità del tuo servizio guardando alla derivata, cioè al fatto che la curva possa crescere o decrescere. E ancora: posso definire cliente chi non mi paga? O chi ha già disdetto e in un paio settimane verrà staccato dal servizio? … Se leggessi oggi il numero di abbonati di un certo operatore nostro concorrente potrebbe sembrarmi un numero importante, ma leggerei anche di un brusco calo negli ultimi mesi … per capire il ‘dato-numero-clienti-in calo’ dovrei sapere che la società, nel dicembre scorso, è stata esposta a un incidente e successivo attacco di hacker con potenziale rischio di clonazione delle sim, evento che sembra aver causato un numero rilevante di disdette. Il numero che raccogli è significativo di una certa cosa che va scoperta, cioè va correlato al tempo e altri dati, costituendo così un insieme che crea un’informazione e permette di prendere una decisione, o di informare la popolazione su un certo comportamento …
D. A proposito di informare la popolazione … con l’aiuto della rubrica “i dati della pandemia” di SkyTG24 e del contatore, ho seguito da febbraio a oggi l’evoluzione della campagna vaccini che secondo me è stata un “allenamento della collettività italiana” per capire cosa significa fare un piano e, con l’aiuto dei numeri, osservare l’attuazione del piano nel mutare del ritmo dall’avvio del progetto verso la sua realizzazione, fino all’avvicinamento all’obiettivo [ii]
R. Il numero va spiegato, facendo capire cosa si sta raccogliendo, aggiungendo pezzi di informazione a informazione. Prendo un numero e in sé mi dice poco o niente: il numero della popolazione in Italia è di poco superiore ai 60 milioni e se lo confronto con il numero della popolazione in Germania che raggiunge quasi 84 milioni ottengo un confronto che dice poco. Ma se aggiungo che i nostri 60 milioni sono tutti concentrati sulle coste e nella pianura padana e pochissimi vivono nelle montagne, questo vuole dire che il territorio di riferimento, quindi la densità abitativa, è tutta legata a un territorio molto più piccolo di quello della Germania che è ben più piatta, e questo è un confronto che mi dà un’informazione. Il numero in sé può essere una curiosità, esprimere un indice generale di quello che sta succedendo. Tornando all’esempio del contatore, il numero che appare nel video dice quanti vaccini sono stati fatti dall’inizio della campagna e dare un’idea della capacità di vaccinazione del paese. Da solo significa poco e occorre relazionarlo con altri dati e con – qui arrivo al punto – i processi produttivi di quella cosa lì …
D. … processi produttivi del dato?
R. … processi produttivi del dato in questo caso legati ai processi produttivi che fisicamente impattano sulla popolazione … il numero cioè è legato a quello che sul territorio viene fatto per vaccinare la gente concretamente. La domanda che potrei fare in base alla mia esperienza è ‘da dove veniva il numero ‘500mila vaccini giornalieri?’ Era un numero collegato a un’aspettativa o era un numero realistico, risultato di una indagine fatta ex-ante per capire la capacità di vaccinare in base a molte azioni messe in campo su diverse variabili – i punti di vaccinazione, la gente che si iscrive e va in un certo posto al momento convenuto, l’organizzazione fisica del posto e la disponibilità delle dosi, etc. – e quando il ‘500mila vaccini giornalieri’ è diventato il numero da raggiungere molti ancora tra aprile e metà maggio esprimevano dubbi.
D. Se pensi che quando si definiva l’obiettivo dei 500mila-vaccini-giorno a fatica si raggiungevano i 300mila, e che la media è poi salita a 470mila dosi circa nel periodo tra 27 aprile e 27 maggio possiamo dirci che il numero non era così campato in aria …
R. Certamente non era campato in aria ma è stato importante avere misurato perché così metti a confronto la realtà con l’immaginazione … ti sei dato un obiettivo vaccini-giorno, come un atleta che vorrebbe correre i 100 metri in 9 secondi … misura il tempo, è un dato, ma se pesa 100 chili e ha una massa muscolare scarsa e non fa qualcosa d’altro non arriverà mai a migliorare il tempo e rimarrà lì per sempre …. Dietro il dato c’è un processo di misura e di azioni per migliorare i numeri.
D. Riassumendo dunque cosa intendi per processo produttivo? … arrivare all’inserimento del numero in un data base?
R. Punto primo: come prendo la misura dà un numero, affidabile o no. Se prendo un termometro e voglio misurare la temperatura dell’acqua che si sta scaldando sul fornello e metto la punta del termometro vicino al fondo del bollitore raggiungo immediatamente quasi 100°, l’acqua bolle? No, perché il processo di misura è sbagliato. Infatti la temperatura varia quanto più metti il termometro vicino o lontano dalla fiamma e il modo corretto sarà una posizione intermedia. La misura richiede una modalità sicura e affidabile di recuperare quel numero.
Punto secondo: la produzione della misura stessa, la fonte e gli standard. Se so che una certa fonte fornisce un numero che si è sempre mostrato poco affidabile nel tempo, finisco per non credere a quel numero e a quella fonte. E se anche la fonte è affidabile ho bisogno di sapere come è stata presa quella misura, di conoscere la forma cioè il modello, lo standard della misurazione per confrontare i dati tra loro e nel tempo. L’Istat nasce con la finalità che lo Stato raccolga dati in modo affidabile, tale da consentire una confrontabilità dei dati negli anni e tra i gruppi, tra i cluster e con dei metodi di misura che devono essere standardizzati.
Per fenomeni complessi la misura è complessa. Negli esempi che facevi sui dati della pandemia dicevi che se si vanno a vedere i dati dei tamponi la domenica sono sempre più bassi … ma è più basso il numero dei tamponi fatti o vengono imputati il giorno successivo? Quindi nel processo produttivo dei dati ci sono la forma e il modo della raccolta del dato e l’inserimento in un posto, un data base, dove è a disposizione di qualcuno per l’elaborazione.
D. E per te qual è la differenza tra numero e dato?
R. Il dato è un numero che ha subito un triage, attraverso una serie di procedure che mi portano dal numero al dato. Se voglio sapere quotidianamente quanti sono i contagiati qualcuno deve raccogliere il singolo contagio e metterlo da qualche parte. Il potenziale contagiato fa un tampone e se il tampone è positivo il suo nome verrà messo in un data base. Ma ci sono situazioni in cui il dato non è affidabile perché la misura non è perfetta, cioè posso avere falsi positivi e veri negativi, cioè dovrò comprendere la possibile percentuale di errore del numero. Oppure, non vado a contare i letti occupati in terapia intensiva ogni volta che ho una variazione, ma avrò un numero derivato, cioè la disponibilità in meno o in più per ogni entrata o uscita. E la persona che esce è guarita o deceduta? Dunque dal numero, cioè dalla raccolta di eventi che permettono di misurare una certa quantità, arriverò all’insieme dei dati e dalla loro elaborazione ricaverò le informazioni che utilizzerò per prendere decisioni.
Con Marco ci fermiamo qui, e lo ringrazio. Allenati dal procedere della campagna vaccinale potremo tutti essere più preparati a comprendere il processo di attuazione del PNRR-NextGenerationEU approvato dal governo a fine aprile. Inoltre in una conferenza stampa di qualche tempo fa il premier Draghi ha comunicato di avere messo sul sito del governo un calendario “con la data di partenza dei cantieri già previsti e finanziati”, a disposizione di tutti e che consente di sapere cosa parte e quando. L’allenamento continua per capire e vivere partecipando sempre meglio.
[i] Il contatore appare in molte edizioni giornaliere di SkyTG24 in alto a destra nel video. La rubrica è spesso introdotta da Alessandro Marenzi, vice-direttore del TG, che illustra le tabelle e commenta la qualità dei dati e spesso sottolinea caratteristiche ricorrenti legate ai dati presentati, quali certe ricorrenze in certi giorni, e molto altro ancora.
[ii] L’obiettivo delle 500mila vaccinazioni giornaliere è stato dichiarato nel mese di marzo, quando il ritmo era ancora lontano da una stabilità sulle 300mila dosi al giorno. Mentre pubblichiamo questa conversazione un giorno di giugno sono state raggiunte le 600mila dosi, superando l’obiettivo giornaliero prefissato a inizio marzo. (nda. la fonte dei dati sulla campagna vaccinazioni è la trasmissione di Sky più volte citata)
Lascia un commento