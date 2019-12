Prendi un appassionato di datajournalism e di est Europa, fagli accompagnare la moglie ad un seggio elettorale e ne esce fuori un'analisi del tutto particolare del recente voto alle presidenziali rumene. Il making of

Sono stati quasi un milione i cittadini rumeni che hanno votato all'estero per il secondo turno delle presidenziali del novembre scorso, in gran parte grazie agli oltre 800 seggi rimasti aperti in tutto il mondo da venerdì 22 a domenica 24 novembre, durante un lungo fine settimana elettorale. In alcune parti d'Europa, si potevano trovare seggi elettorali non solo nelle capitali o nei principali centri urbani, ma anche in luoghi relativamente remoti.

Ad esempio, in una domenica piovosa, io ci ho messo circa 25 minuti per accompagnare in auto mia moglie ad un seggio elettorale partendo dal piccolo villaggio alpino dove vivo.

Esaminando su una mappa la densità dei seggi elettorali in Italia, avevo la sensazione di non essere troppo fortunato, e che molti elettori romeni in Italia avessero un seggio più a portata di mano. Ma era davvero così? Quanto era distante il residente italiano medio da un seggio elettorale romeno il 24 novembre 2019? Ho deciso di scoprirlo.

Trovare la distanza tra residenti e seggi elettorali

Quanto dista il residente italiano medio da un seggio per le elezioni presidenziali in Romania? Per rispondere a questa domanda, prima dobbiamo sapere dove si trovano i seggi elettorali, in secondo luogo dobbiamo sapere dove vivono effettivamente i residenti italiani, quindi, beh, calcolarne la distanza.

1. Il ministero degli Affari esteri romeno ha pubblicato una mappa con tutti i seggi elettorali per le ultime elezioni sul proprio sito web . Non sono sicuro che abbia pubblicato le coordinate di ogni posizione come open data, ma, consapevolmente o meno, tutti gli indirizzi e le coordinate sono stati lasciati in un json ben formattato: basta guardare il codice sorgente di quella pagina (ad esempio facendo ctrl+U con Firefox).

2. Nel 2011, Eurostat ha pubblicato una griglia della popolazione per tutta l'UE. Che cos'è una griglia della popolazione? Fondamentalmente, divide la superficie di un paese in quadrati della dimensione di 1 km e indica quante persone vivono in ciascuno di questi quadrati. A che cosa ci serve la griglia della popolazione? Se vogliamo calcolare in modo significativo quanto tempo impiegherebbe l'italiano medio a raggiungere un seggio elettorale romeno, dobbiamo sapere che ci sono più residenti in un centro urbano che in cima ad una montagna.

Ecco i nostri dati su una mappa, i seggi elettorali romeni sopra la griglia della popolazione italiana:

Ora che abbiamo i dati, trovare la risposta alla mia domanda è "semplice": misuriamo la distanza tra ogni cella della griglia della popolazione e ogni seggio elettorale in Italia per scoprire qual è la più vicina. Quindi sarà possibile calcolare la distanza media (o mediana), ponderando il numero di residenti che vivono in ciascun chilometro quadrato che compone la griglia.

Nella griglia della popolazione italiana ci sono 172.216 celle da un chilometro quadrato e, senza fare altre ipotesi, controlleremo quale sia il seggio elettorale più vicino a ciascuna di esse.

Questo è un processo ad alta intensità di elaborazione (ci sono volute circa 6 ore sul mio laptop), ma e proprio a questo che servono i computer. Quindi, qualche ora dopo, ecco la tanto ambita risposta: in media, un residente italiano vive a meno di 18 km da un seggio elettorale romeno1. Ed il 50% degli italiani vive a meno di 13 km da un seggio elettorale romeno2.

Riassumendo di nuovo come abbiamo ottenuto questo numero: Eurostat pubblica una griglia della popolazione che indica quante persone vivono in ogni chilometro quadrato del continente. Dopo aver calcolato la distanza fra il centro di ciascuna di queste celle e la posizione di un seggio elettorale romeno, abbiamo calcolato un valore medio ponderato, "ponderato" in base al numero di persone che vivono in ciascun chilometro quadrato, in modo che i luoghi con molti residenti nelle città "pesino" più dei luoghi con pochi residenti nelle campagne.

Ma... ma... pensi che le persone arrivino ai seggi elettorali volando?

Sì, caro lettore, hai ragione. Ho calcolato la distanza in linea d'aria. Intendiamoci, credo che questi dati siano molto eloquenti e degni di nota, poiché i residenti della maggior parte dei paesi europei dovrebbero probabilmente fare centinaia di chilometri in auto per raggiungere un seggio elettorale se si trovassero all'estero il giorno delle elezioni. Ma, come ricorderete sicuramente dall'inizio di questo articolo, io vivo nelle Alpi, dove le montagne possono frapporsi tra un residente italiano e il suo amato seggio elettorale romeno, e in effetti lo fanno. Ancora peggio, il saggio abitante delle Alpi sa per esperienza che il luogo che appare più vicino sulla mappa non è necessariamente quello più facile da raggiungere.

Partiamo dal mio Trentino-Alto Adige: griglia della popolazione e seggi elettorali romeni.

Anche se la mappa non mostra le montagne, dalla griglia della popolazione è facile intuirne la presenza.

Passiamo ad un esempio specifico. Mettiamo che qualcuno a Vigo Cavedine, dove risiede parte della mia famiglia, voglia localizzare il più vicino seggio elettorale romeno. Scoprirebbe presto che, in linea d'aria, il seggio elettorale più vicino è a Rovereto, a soli 11 km.

Ma la brava gente di Vigo Cavedine non si lascia fuorviare così facilmente da tutti questi dati, e sa che Trento è in realtà più facile da raggiungere3.

E ha ragione:

Infatti, ci vogliono circa 10 minuti in meno per raggiungere il seggio elettorale a nord di Trento rispetto a quello di Rovereto; su strada, è anche circa 7 km più vicino.

Ora, se dovessimo rispondere a questa domanda solo per la brava gente di Vigo Cavedine, potremmo semplicemente usare Google Maps, o chiedere in giro. Ma noi vogliamo trovare questo dato per tutte le 172.216 celle della griglia della popolazione italiana. Poiché non possiamo dare per scontato che "il più vicino" sia anche "il più facile da raggiungere", significa che dovremo fare più di una 'query' per ogni cella. Anche se cerchiamo, mettiamo, i 5 seggi elettorali più vicini, sono 861.080 query. Google fa pagare 5 dollari ogni 1000 query , il che significa... un attimo... 4.305 dollari.

Non male, ma forse un po' caro per la curiosità di una domenica pomeriggio di pioggia.

Ci viene in soccorso OpenStreetMap, che è ragionevolmente completo in termini di collegamenti stradali in Italia. Sfortunatamente, non esiste un servizio OpenStreetMap che mi permetta di effettuare gratuitamente centinaia di migliaia di query, ma a caval donato... Ho installato sul mio laptop OSRM , il software di routing di OpenStreetMap, scaricato i dati per l'Italia (grazie, collaboratori di OpenStreetMap!), li ho preparati per il routing e... via4!

Dato che a quel punto avevo un motore di routing sul mio laptop, e potevo torturarlo a mio piacimento, non ho nemmeno limitato il numero di seggi da controllare, e ho fatto calcolare la distanza tra ogni cella della griglia e ogni seggio. Eh sì, sono più di venti milioni di query (distanza e tempo sono due query separate)... ma visto che potevo e non dovevo dare 116.246 dollari a Google...

OSRM è molto veloce, e sul mio laptop economico ha masticato tutto in circa 15 ore.

In un luminoso lunedì mattina...

... Potevo svegliarmi e sentirmi fortunato. Ancora meglio, sapevo di essere fortunato.

In media, un italiano dovrebbe fare circa 40 minuti in auto per raggiungere un seggio elettorale romeno. La metà degli italiani potrebbe raggiungerne uno in meno di 35 minuti. Io ce ne ho messi solo 25: ero ufficialmente fortunato.

Il numero esatto che emerge dai calcoli? Eccolo qua: 17.691. È importante tenere in considerazione che, poiché questi calcoli si basano sulla posizione centrale delle celle da 1 km, questo comporta approssimazioni significative.↩ Sì, carissimi appassionati di statistiche, questa è la mediana che tutti vorreste: esattamente 12.768. Vedi la nota precedente: non siamo precisi al metro esatto.↩ A proposito, avete notato? Blu, giallo e rosso: è la bandiera romena!↩ La documentazione di OSRM non è male ed è facile da installare in poche righe di comando... suggeriscono di eseguire OSRM in Docker, ma ho trovato più facile gestire i problemi di RAM semplicemente eseguendolo dall'host. La preparazione dei dati a livello di paese per il routing potrebbe richiedere un'ora o più e sarà necessario disporre di circa 10 GB di RAM per un paese delle dimensioni dell'Italia (farlo con una mappa europea potrebbe non essere un'opzione praticabile sulla maggior parte dell'hardware di consumo). Il download e l'estrazione dei dati sono solo quattro righe di codice, le trovate nella versione completa del codice di questo post.↩

