Che cosa sono i Big data?

Che cosa sono i Big data?

I “Big data” sono come una gigantesca biblioteca piena di libri di ogni tipo: romanzi, libri di scienza, fumetti, enciclopedie, e molto altro. Ogni libro contiene informazioni su argomenti diversi.

Nel caso dei “big data”, invece di libri, ci sono grandi quantità di dati, o informazioni, raccolti da computer, telefoni, satelliti, e molti altri dispositivi.


Immagina di avere una mappa del cielo piena di stelle: ogni stella è un pezzettino di informazione.Quando metti insieme tutte queste stelle, puoi iniziare a vedere costellazioni, che sono come modelli o tendenze nei dati.

Gli scienziati e le aziende usano i big data per capire meglio il mondo, come per prevedere il tempo, capire quali film la gente preferisce guardare, o per trovare modi per rendere le macchine più intelligenti.

Pensa a quando usi Internet per cercare qualcosa: ogni ricerca che fai è un piccolo pezzo di dato. Messo insieme a tutte le altre ricerche fatte da milioni di persone, aiuta a capire cosa è popolare o importante in quel momento.

Cosa si fa con i dati?

Immagina di avere un sacco di pezzi LEGO di diverse forme, colori e dimensioni. Questi pezzi sono come i dati che vengono raccolti. Vengono da molti posti diversi: telefoni, computer, negozi, ospedali, satelliti nello spazio e molti altri.

Ogni volta che usi il tuo telefono o computer, per esempio, stai creando piccoli pezzi di dati che possono essere raccolti.

Una volta che hai tutti questi pezzi LEGO (dati), devi trovare un modo per organizzarli. Questo è come ordinare i tuoi LEGO per colore, forma o dimensione.

Nella realtà dei big data, i dati vengono ordinati in modi che li rendono utili. Possono essere organizzati per data, per tipo (come foto, testo, numeri) o per argomento (come dati meteo, informazioni di shopping, o risultati di ricerca su Internet).

Dopo aver ordinato i tuoi LEGO, puoi iniziare a costruire qualcosa. Lo stesso vale per i big data. Una volta che i dati sono raccolti e organizzati, gli scienziati e le aziende li analizzano per trovare modelli, tendenze, o per ottenere risposte a specifiche domande.

Immagina di avere un puzzle con tanti pezzi. Quando inizi a mettere insieme i pezzi che si assomigliano, come quelli che hanno lo stesso colore o la stessa forma, inizi a vedere una parte dell’immagine del puzzle.

Questo è un po’ come trovare un modello nei dati.

Per esempio, se un negozio raccoglie dati su quali giocattoli vengono comprati più spesso, potrebbe scoprire che durante l’inverno si vendono più puzzle e giochi da tavolo. Questo è un modello: la tendenza che in inverno le persone comprano più giochi da tavolo e puzzle.

Le tendenze sono come guardare come cambiano le cose nel tempo. Usando l’esempio del negozio di giocattoli, se i dati mostrano che ogni anno si vendono più giochi elettronici e meno giochi da tavolo, questa è una tendenza. Significa che nel tempo le preferenze delle persone stanno cambiando da giochi da tavolo a giochi elettronici.

I dati possono essere strutturati o non strutturati.
Leggi questo breve articolo per capire la differenza
Dati strutturati e dati non strutturati

A partire dai dati strutturati e isolando quelli con determinate caratteristiche comuni (attributi) è possibile scoprire delle tendenze o dei modelli. Nel fare questo si può seguire il metodo degli alberi delle decisioni. Leggi questo breve articolo per capire di cosa si tratta: Che cos’è un albero delle decisioni?

Prima di analizzare i dati, questi possono essere visualizzati mediante disegni e grafici.

Gli strumenti di visualizzazione dei dati sono come pennarelli colorati e album da disegno che ti aiutano a trasformare numeri e parole in immagini facili da capire, come grafici e mappe. Ecco alcuni esempi di questi strumenti:

Tableau: È come un set di pennarelli super colorati. Tableau ti aiuta a creare grafici e mappe molto dettagliati e belli da vedere. È facile da usare e ti permette di vedere i dati in modi diversi, come in un grafico a barre o in una mappa.

Microsoft Power BI: Questo è come un kit di arte che non solo ha pennarelli, ma anche stencil e modelli. Power BI è ottimo per persone che usano molto Microsoft Office, perché funziona bene con programmi come Excel. Ti permette di fare grafici interattivi dove puoi cliccare e vedere più dettagli.

Google Charts: È come avere un album da disegno che si connette a Internet. Google Charts è buono per fare grafici che puoi mettere sui siti web. È gratuito e funziona bene con altri servizi Google come Google Sheets.

D3.js: Questo è per chi ama disegnare da zero. D3.js è come una scatola di matite e pennelli che ti permettono di creare qualsiasi tipo di grafico. È un po’ più complicato da usare, ma puoi fare grafici molto personalizzati e creativi.

Perchè l’AI è ghiotta di dati?

L’Intelligenza Artificiale (AI) ha bisogno di dati per la stessa ragione per cui un cuoco ha bisogno di ingredienti per cucinare un piatto. Senza ingredienti, il cuoco non può preparare nulla. Allo stesso modo, l’AI ha bisogno di dati per “imparare” e fare il suo lavoro.

L’AI, specialmente quella che usa il machine learning, impara guardando esempi, proprio come impari a riconoscere i diversi tipi di frutta vedendoli e mangiandoli. Più dati ha (come immagini, testi, numeri), più esempi ha da cui imparare.

Come un cuoco diventa migliore provando diverse ricette, l’AI migliora analizzando più dati. Questo processo si chiama “allenamento”. L’AI esamina i dati, prova a fare previsioni o decisioni, e poi impara dai suoi errori.

I dati aiutano l’AI a vedere modelli e tendenze, proprio come noti che la frutta matura in certi periodi dell’anno. Per esempio, l’AI può usare i dati per riconoscere il modello di parole in una lingua o per prevedere il tempo.

Con abbastanza dati, l’AI può imparare a gestire situazioni diverse, proprio come un cuoco che impara a cucinare piatti di diverse cucine. Più dati ha su vari argomenti, più può essere versatile e utile in diverse situazioni.

Senza dati, l’AI non avrebbe “niente da cucinare” e non potrebbe imparare o migliorare. I dati sono il suo cibo e il suo insegnante!

Dove saranno reperibili i dati?

Nel futuro, si pensa di ottenere dati in modi sempre più avanzati

Immagina una casa dove quasi tutto, dal frigorifero alla lampadina, è connesso a Internet e può raccogliere dati.

In futuro, più dispositivi saranno connessi e produrranno dati, aiutandoci a capire meglio come viviamo e lavoriamo.

Auto che si guidano da sole raccolgono molti dati per muoversi in sicurezza. In futuro, potrebbero raccogliere dati non solo sulla strada, ma anche sull’ambiente circostante, come il traffico e le condizioni meteo.

Satelliti e droni potrebbero raccogliere dati su larga scala, come monitorare i cambiamenti climatici o aiutare nell’agricoltura, fornendo informazioni dettagliate sulla salute delle colture o sui bisogni idrici.

Orologi intelligenti e altri dispositivi indossabili che misurano la nostra salute potrebbero diventare più avanzati, raccogliendo dati più dettagliati sul nostro benessere e sulla nostra attività fisica.

Sensori ambientali potrebbero raccogliere dati su inquinamento, qualità dell’aria, e altre condizioni ambientali, aiutandoci a proteggere meglio il nostro pianeta.

Continueremo a generare dati tramite i social media, le ricerche online, e altre interazioni digitali, fornendo un flusso costante di informazioni sulle tendenze culturali e sui comportamenti.