Bayes… chi? Un approccio alternativo ai test statistici

Immaginate di iniziare un nuovo lavoro e di dover guidare il primo giorno fino al nuovo ufficio. Non ci siete mai stati, ma sapete che è a fianco a una palestra che conoscete abbastanza bene, avendola frequentata in passato. Sapete che il tempo per arrivare alla palestra, a quell’ora del giorno, è di circa 30 minuti, anche se l’ultima volta è stata più di un anno fa (ahimè, avete poi smesso di andare in palestra, ma questa è un’altra storia). Oggi è il primo giorno di lavoro e state per decidere a che ora uscire di casa. Immaginiamo per un attimo di non avere accesso ai dati del navigatore. Cosa fate:

  1. Utilizzate le informazioni che avete a disposizione (per quanto obsolete) e pianificate per una durata del viaggio di 30 minuti circa?
  2. Oppure ignorate completamente quello che già sapete e provate a guidare il primo giorno scegliendo un orario di partenza casuale?

Ovviamente viene naturale scegliere la prima opzione, cioè sfruttare le informazioni già a disposizione, piuttosto che ignorarle completamente.

Bene, se siete d’accordo su questo, siete già a buon punto per utilizzare un approccio Bayesiano alla statistica.

Continua a leggere

Si riparte!

Siamo tornati! Dopo 8 lunghi anni, inizia la seconda vita di Datastory.it. D’altronde, se David Lynch ha aspettato più di 25 anni tra una stagione e l’altra di Twin Peaks, i nostri 8 non sembrano poi così tanti.

Tante cose sono cambiate in questo periodo, ma non la nostra voglia di forgiare storie attraverso i dati. Ci auguriamo anche la vostra voglia di leggerle!

Il nostro manifesto resta lo stesso, sostenuto dallo stesso entusiasmo degli albori ma con molte più storie, aneddoti ed esperienze da raccontare. Da oggi inoltre il sito ha anche una sezione in inglese con tutti gli articoli tradotti.

Mettetevi comodi e buona lettura!

Le trappole della correlazione

Avete mai sentito dire una frase del genere? “E’ appena uscito un nuovo film di Nicholas Cage, quindi sta per aumentare il numero di persone affogate in piscina”. Probabilmente no, e se davvero l’aveste sentita dire da qualche amico… beh, vi sarete fatti due domande sulla sua sanità mentale. Eppure, guardando il grafico qui sotto – basato su dati reali – il vostro amico sembrerebbe aver ragione.

grafico-correlazione

 

Cosa ci dice questo grafico?        Continua a leggere

Il paradosso delle torte

Qualche giorno fa a lavoro mi sono trovato di fronte ad una di quelle situazioni dove i numeri si comportano in maniera contro intuitiva. Situazione dove un ragionamento apparentemente logico porta a conclusioni errate, un cosiddetto paradosso da me soprannominato il paradosso delle torte.

Ho tirato in ballo le torte proprio perché me ne sono servito per spiegare (con difficoltà) ai miei colleghi dove stesse il trucco.

Proviamo a ripercorrere il tutto con un esempio simile (dati di fantasia a scopo esemplificativo):

Continua a leggere

L’inutilità dei numeri assoluti

Qualche giorno fa leggevo questo articolo sugli incidenti che capitano ai ciclisti. Essendo un appassionato di biciclette e avendo a che fare ogni giorno con dati e numeri di ogni tipo, ho notato subito questa frase: “Le regioni maggiormente interessate da incidenti sono quelle dove le biciclette sono una vera e propria tradizione: Lombardia, Veneto, Emilia Romagna e Toscana. Gli episodi si concentrano il sabato e la domenica, tra le 10 e le 12, periodo maggio-ottobre, con un picco isolato in agosto”.

Cosa notate di strano?

Continua a leggere

Datastory.it al KNIME Spring Summit 2016

Il 24-26 febbraio 2016 datastory.it parteciperà al KNIME Spring Summit 2016 a Berlino, conferenza annuale degli utilizzatori di KNIME. KNIME è un data analytic software non molto diffuso ma molto apprezzato da chi lo utilizza, confermato anche nel 2016 tra i migliori software della sua categoria secondo la prestigiosa Gartner.

La cosa più bella di KNIME è che lo potete scaricare direttamente dal proprio sito internet essendo totalmente gratuito e open source.

I non addetti ai lavori si staranno chiedendo a cosa serve KNIME. Di seguito alcuni esempi:

Continua a leggere

Diffidate dei ritardatari

Quando si crea un blog, una delle prime cose da fare è trovare un nome. Prima di scegliere il nome datastory.it, abbiamo valutato varie proposte, ma alcune di esse appartenevano a domini già occupati. Su uno di questi siti abbiamo trovato una frase che ci ha fatto rizzare quei pochi capelli rimasti in testa, e che recitava più o meno una cosa del genere: “Questo sito contiene un algoritmo capace di generare numeri per il gioco del Lotto che hanno una probabilità maggiore di essere estratti rispetto agli altri”.

Ecco, parole del genere suonano alle orecchie di uno statistico più o meno come una bestemmia suona alle orecchie di un prete. Avete mai sentito parlare di “numeri caldi” o “ritardatari”? Sicuramente si. Ebbene, vi possiamo garantire che questi numeri non hanno alcun senso e quindi non c’è nessun algoritmo capace di generare numeri più probabili di altri. Cerchiamo di capirne il perché.

Continua a leggere

La triste storia del tacchino induttivista

E’ il cenone di Natale, allegoria dell’abbondanza e palcoscenico dell’opulenza. Il vostro vicino di posto, probabilmente un cugino di quarto grado di cui ricordate a malapena il nome, sembra dare i primi segni di cedimento e cerca invano il vostro sguardo complice. Ma voi con finta nonchalance e incauta intraprendenza vi mostrate ancora affamati nonostante la quantità di cibo appena ingerita possa bastare per soddisfare il fabbisogno calorico dell’intera provincia di Isernia. Ecco quindi comparire sulla tavola imbandita, allo scoccare della terza ora di cena, una nuova portata succulenta: un bel tacchino ripieno. Allora, in un fugace scampolo di coscienza, che in queste occasioni viene opportunamente lasciata a casa (non si capirebbe altrimenti il motivo di una quantità così spropositata di cibo) vi interrogate sulla storia del tacchino che avete davanti.

Ebbene, questo tacchino viveva in un allevamento in cui sin dal primo giorno gli venne dato da mangiare regolarmente. Il tacchino si accorse che il cibo veniva portato tutti i giorni alla stessa ora, indipendentemente dalla stagione, dal clima o da altri fattori esterni.

Continua a leggere

Un approccio statistico al terrorismo

Datastory.it è anche attualità e a seguito degli attentati di Parigi vogliamo condividere la nostra opinione a riguardo.

La serie di attacchi che ha colpito la capitale francese il 13 novembre 2015 sembra aver scosso l’opinione pubblica e mobilitato i governi europei. Sui giornali, nei parlamenti e nei consessi internazionali non si parla d’altro che di come garantire la sicurezza ed evitare che gli atroci avvenimenti di Parigi possano ripetersi. Molte le ipotesi al vaglio, ho sentito parlare di controlli più stringenti alle frontiere, revisione del trattato di Schengen, sorveglianza aumentata nei luoghi a rischio, installazione di telecamere nelle grandi città.

E ancora, più uomini e risorse per il comparto sicurezza (la stampa parla di 400milioni di euro in Belgio, 120 in Italia). E poi i bombardamenti in Iraq e Siria con Stati Uniti, Russia e Francia tra i protagonisti. Alcune stime parlano di 10 milioni di dollari al giorno spesi dagli Stati Uniti, circa un terzo dalla Russia.

Continua a leggere

« Articoli meno recenti

© 2025 Datastory.it

Tema di Anders NorenSu ↑