Dati strutturati e dati non strutturati

Dati strutturati e dati non strutturati

Immagina che i dati siano come libri in una stanza. I dati strutturati sono come libri ben ordinati in una libreria: ogni tipo di libro è nel suo ripiano, Questi dati sono facili da trovare e organizzare perché sappiamo esattamente dove sono e come sono sistemati.

D’altro canto, i dati non strutturati sono come un mucchio di documenti e libri sparsi senza un ordine preciso. È più difficile trovare qualcosa in specifico perché non c’è un sistema di organizzazione.

In termini tecnici,

i dati strutturati sono organizzati in un modo che il computer può facilmente capire e usare, come in tabelle o database.

Ad esempio, in una tabella che elenca i nomi degli studenti con i loro voti, è facile trovare il voto di uno studente specifico. La stessa cosa si può dire per opere importanti presenti in una tabella che le cataloga per data e categoria

I dati non strutturati, invece, non hanno una forma organizzata e possono includere cose come testi, immagini, video o social media posts. Questi sono più complicati da analizzare perché non seguono un modello preciso.

Come si fa a mettere in ordine?

Rendere strutturati i dati non strutturati è un po’ come mettere in ordine la libreria. Ecco come si può fare:

Identificare e Categorizzare: Prima di tutto, devi capire che tipo di dati hai. Per esempio, se hai un mucchio di testi, immagini e video, devi capire cosa c’è in ogni pezzo di dato. È come guardare ogni giocattolo e decidere se è una macchinina, una bambola, o un blocco di costruzione.

Estrarre Informazioni Utili: Poi, estrarre informazioni utili dai dati. Ad esempio, se hai dei testi, potresti cercare nomi, date o luoghi menzionati.

Organizzare in una Struttura: Dopo, metti queste informazioni in una struttura organizzata, come una tabella o un database. Per esempio, potresti creare una tabella dove ogni riga rappresenta un testo e ogni colonna contiene informazioni come la data del testo, il tema principale, ecc.

Usare Strumenti di Elaborazione: A volte, per fare questo lavoro si usano strumenti speciali di informatica, come algoritmi di intelligenza artificiale, che aiutano a capire e organizzare i dati.

Aggiornamento e Manutenzione: Infine, una volta che i dati sono organizzati, è importante tenerli aggiornati e controllare periodicamente per assicurarsi che tutto sia ancora al posto giusto.

L‘intelligenza artificiale riesce a mettere ordine nei dati. Per esempio gli algoritmi di clustering sono come maghi che organizzano i dati in gruppi basati su somiglianze che vedono. Nell’AI, questi algoritmi raggruppano i dati simili insieme senza sapere in anticipo le categorie. Ad esempio, possono prendere un mucchio di articoli e raggrupparli in argomenti simili.

Vuoi approfondire il tema degli algoritimi di clustering?
Leggi: Il clustering: come l’AI apprende senza troppi “preconcetti”