Le trappole della correlazione

Avete mai sentito dire una frase del genere? “E’ appena uscito un nuovo film di Nicholas Cage, quindi sta per aumentare il numero di persone affogate in piscina”. Probabilmente no, e se davvero l’aveste sentita dire da qualche amico… beh, vi sarete fatti due domande sulla sua sanità mentale. Eppure, guardando il grafico qui sotto – basato su dati reali – il vostro amico sembrerebbe aver ragione.

grafico-correlazione

 

Cosa ci dice questo grafico?        Continua a leggere

Il paradosso delle torte

Qualche giorno fa a lavoro mi sono trovato di fronte ad una di quelle situazioni dove i numeri si comportano in maniera contro intuitiva. Situazione dove un ragionamento apparentemente logico porta a conclusioni errate, un cosiddetto paradosso da me soprannominato il paradosso delle torte.

Ho tirato in ballo le torte proprio perché me ne sono servito per spiegare (con difficoltà) ai miei colleghi dove stesse il trucco.

Proviamo a ripercorrere il tutto con un esempio simile (dati di fantasia a scopo esemplificativo):

Continua a leggere

L’inutilità dei numeri assoluti

Qualche giorno fa leggevo questo articolo sugli incidenti che capitano ai ciclisti. Essendo un appassionato di biciclette e avendo a che fare ogni giorno con dati e numeri di ogni tipo, ho notato subito questa frase: “Le regioni maggiormente interessate da incidenti sono quelle dove le biciclette sono una vera e propria tradizione: Lombardia, Veneto, Emilia Romagna e Toscana. Gli episodi si concentrano il sabato e la domenica, tra le 10 e le 12, periodo maggio-ottobre, con un picco isolato in agosto”.

Cosa notate di strano?

Continua a leggere

Datastory.it al KNIME Spring Summit 2016

Il 24-26 febbraio 2016 datastory.it parteciperà al KNIME Spring Summit 2016 a Berlino, conferenza annuale degli utilizzatori di KNIME. KNIME è un data analytic software non molto diffuso ma molto apprezzato da chi lo utilizza, confermato anche nel 2016 tra i migliori software della sua categoria secondo la prestigiosa Gartner.

La cosa più bella di KNIME è che lo potete scaricare direttamente dal proprio sito internet essendo totalmente gratuito e open source.

I non addetti ai lavori si staranno chiedendo a cosa serve KNIME. Di seguito alcuni esempi:

Continua a leggere

Il teorema della rovina del giocatore

Nutro da sempre un certo fascino per il gioco d’azzardo, l’adrenalina generata dal rischio, il sogno della grande vincita.

Sin da quando ho iniziato a capire come funziona la roulette  sono rimasto sorpreso da quanto fosse “equo” questo gioco.

Continua a leggere

Diffidate dei ritardatari

Quando si crea un blog, una delle prime cose da fare è trovare un nome. Prima di scegliere il nome datastory.it, abbiamo valutato varie proposte, ma alcune di esse appartenevano a domini già occupati. Su uno di questi siti abbiamo trovato una frase che ci ha fatto rizzare quei pochi capelli rimasti in testa, e che recitava più o meno una cosa del genere: “Questo sito contiene un algoritmo capace di generare numeri per il gioco del Lotto che hanno una probabilità maggiore di essere estratti rispetto agli altri”.

Ecco, parole del genere suonano alle orecchie di uno statistico più o meno come una bestemmia suona alle orecchie di un prete. Avete mai sentito parlare di “numeri caldi” o “ritardatari”? Sicuramente si. Ebbene, vi possiamo garantire che questi numeri non hanno alcun senso e quindi non c’è nessun algoritmo capace di generare numeri più probabili di altri. Cerchiamo di capirne il perché.

Continua a leggere

La triste storia del tacchino induttivista

E’ il cenone di Natale, allegoria dell’abbondanza e palcoscenico dell’opulenza. Il vostro vicino di posto, probabilmente un cugino di quarto grado di cui ricordate a malapena il nome, sembra dare i primi segni di cedimento e cerca invano il vostro sguardo complice. Ma voi con finta nonchalance e incauta intraprendenza vi mostrate ancora affamati nonostante la quantità di cibo appena ingerita possa bastare per soddisfare il fabbisogno calorico dell’intera provincia di Isernia. Ecco quindi comparire sulla tavola imbandita, allo scoccare della terza ora di cena, una nuova portata succulenta: un bel tacchino ripieno. Allora, in un fugace scampolo di coscienza, che in queste occasioni viene opportunamente lasciata a casa (non si capirebbe altrimenti il motivo di una quantità così spropositata di cibo) vi interrogate sulla storia del tacchino che avete davanti.

Ebbene, questo tacchino viveva in un allevamento in cui sin dal primo giorno gli venne dato da mangiare regolarmente. Il tacchino si accorse che il cibo veniva portato tutti i giorni alla stessa ora, indipendentemente dalla stagione, dal clima o da altri fattori esterni.

Continua a leggere

Un approccio statistico al terrorismo

Datastory.it è anche attualità e a seguito degli attentati di Parigi vogliamo condividere la nostra opinione a riguardo.

La serie di attacchi che ha colpito la capitale francese il 13 novembre 2015 sembra aver scosso l’opinione pubblica e mobilitato i governi europei. Sui giornali, nei parlamenti e nei consessi internazionali non si parla d’altro che di come garantire la sicurezza ed evitare che gli atroci avvenimenti di Parigi possano ripetersi. Molte le ipotesi al vaglio, ho sentito parlare di controlli più stringenti alle frontiere, revisione del trattato di Schengen, sorveglianza aumentata nei luoghi a rischio, installazione di telecamere nelle grandi città.

E ancora, più uomini e risorse per il comparto sicurezza (la stampa parla di 400milioni di euro in Belgio, 120 in Italia). E poi i bombardamenti in Iraq e Siria con Stati Uniti, Russia e Francia tra i protagonisti. Alcune stime parlano di 10 milioni di dollari al giorno spesi dagli Stati Uniti, circa un terzo dalla Russia.

Continua a leggere

Si parte! Cos’è datastory.it?

Datastory.it è una fucina di numeri, informazioni e impressioni sulla realtà che ci circonda. Non un semplice contenitore, ma una bottega piena di attrezzi dove il dato grezzo viene analizzato e filtrato fino ad estrapolarne un contenuto essenziale di informazione. Come artigiani dei numeri, plasmeremo il dato e gli daremo linfa vitale per farlo diventare un valido aiuto nell’interpretazione della realtà.

Il dato scientifico sarà la stella polare che guiderà il nostro cammino attraverso gli avvenimenti della realtà che ci circonda. Ma le rotte da seguire per arrivare a destinazione possono essere molteplici e ben diverse tra loro.

Il dato infatti è univoco ma contraddittorio, è inequivocabile ma al tempo stesso ambiguo, perno fondamentale di una teoria e colonna portante del suo esatto opposto. Chi lavora con i numeri sa che quello che conta non è il dato in sé, ma l’interpretazione che gli si dà, e di conseguenza la “storia” che ci si costruisce intorno.

La nostra intenzione è quella di non fermarsi alla prima impressione del numero, di non imboccare la strada più semplice perché apparentemente immediata e priva di trappole. Al contrario, cercheremo di analizzare il dato in tutte le sue mille sfaccettature e interpretare la realtà in modo inusuale, talvolta anche provocatorio o dissacrante.

Ma non vi annoieremo solamente con numeri e storie di numeri, cercheremo di raccontare anche il mondo di chi lavora con i numeri (mondo del quale facciamo parte). E da ultimo, ci riserveremo di utilizzare questa piattaforma per condividere le nostre storie e le nostre idee, perdonateci se qualche post risulterà essere un po’ fuori tema.

Benvenuti a bordo e buon ascolto…

“…few people will appreciate the music if I just show them the notes. Most of us need to listen to the music to understand how beautiful it is. But often that’s how we present statistics; we just show the notes we don’t play the music.” 
Hans Rosling

 

© 2024 Datastory.it

Theme by Anders NorenUp ↑