La ricerca scientifica con l’intelligenza artificiale

La ricerca scientifica con l’intelligenza artificiale

Non c’è dubbio che il progresso tecnologico degli ultimi decenni abbia portato a grandi avanzamenti nei campi della scienza e in particolare della medicina. Comunque, allo stesso tempo, sembra che molti problemi restino ancora irrisolti, soprattutto nell’ambito sanitario. L’intelligenza artificiale sta rapidamente emergendo come una delle soluzioni più innovative per superare questi limiti.

Grazie all’utilizzo di tecniche avanzate di machine learning e di deep learning, l’AI sta già dimostrando di avere una grande efficacia nella ricerca di nuove scoperte e nella diagnosi e cura di malattie. Ma quali sono ancora i principali problemi da risolvere in questo campo? Come può l’AI essere utilizzata in modo efficiente e sicuro per il bene della salute umana? E che impatto avrà questa tecnologia sul futuro della medicina e della ricerca scientifica?

Esploriamo il ruolo dell’intelligenza artificiale nella ricerca scientifica e nella medicina, esaminando le principali applicazioni.

Il riconoscimento di pattern e attività di previsione in biologia

La creazione di modelli di intelligenza artificiale (AI) per il riconoscimento di pattern e la previsione dei risultati è una delle applicazioni più utili dell’IA in ambito scientifico, come la biologia.

Ad esempio, l’AI può essere utilizzata per analizzare le immagini delle cellule biologiche e per identificare le differenze tra quelle normali e quelle anomale. Grazie alla capacità della macchina di apprendere autonomamente, questa tecnologia è in grado di rilevare i piccoli dettagli e le somiglianze tra le cellule in modo molto preciso, offrendo un risultato più accurato rispetto alle tecniche manuali. Questa tecnologia trova anche applicazione nell’identificazione dei diversi tipi di microorganismi, tra cui i batteri patogeni.

I modelli AI di previsione possono essere utilizzati per identificare le correlazioni tra i dati, come ad esempio quelli raccolti in uno studio di biologia, per fornire una previsione delle possibili conseguenze di un’azione o di un evento futuro. Ad esempio, uno studio potrebbe utilizzare l’AI per prevedere la crescita di batteri in un ambiente di coltura, o per interpretare i dati dell’imaging per una diagnosi precoce delle malattie.

Va ricordato che la creazione di questi modelli richiede l’utilizzo di una grande quantità di dati, in particolare dati etichettati, che possono essere utilizzati per addestrare l’algoritmo.

Cura del cancro e sviluppo di nuovi farmaci

Le tecniche indicate possono essere utilizzate anche per diagnosticare diversi tipi di malattie o disturbi, come ad esempio il cancro, la malaria e la tubercolosi. L’AI può anche essere impiegata nella ricerca e nello sviluppo di nuovi farmaci, poiché può analizzare in modo accurato i filmati a lungo termine dei microrganismi e delle infezioni in vivi, supportando la previsione dell’efficacia dei farmaci.

L’AI lavora per identificare il legame che intercorre tra la struttura molecolare del farmaco e il suo effetto biologico. Ciò è possibile grazie all’analisi e all’elaborazione di un grande quantitativo di dati, tra cui sequenze di DNA, risultati di test in vitro e in vivo, dati demografici del paziente e informazioni sulla tossicità.

Ad esempio, l’algoritmo può cercare fra quei composti che hanno la maggior probabilità di influire sulla capacità del virus di penetrare nella cellula, o può identificare il sito di attacco di un enzima o di un altro recettore molecolare all’interno dell’organismo. Inoltre, l’AI può aiutare a prevedere la probabilità che una particolare molecola sia tossica o causi effetti collaterali indesiderati per essere utilizzata in futuro.

Nell’ambito della ricerca farmacologica un’altra applicazione dell’AI riguarda l’identificazione di nuovi antibiotici. L’analisi di milioni di composti chimici e l’identificazione dei peptidi di difesa delle piante sono soltanto alcuni dei modi in cui l’AI può essere utilizzata per sviluppare nuovi trattamenti contro batteri resistente agli antibiotici.

Il successo dell’apprendimento automatico, come abbiamo già anticipato, dipende dalla grande quantità di dati che viene utilizzata per addestrare l’algoritmo. Attualmente, esistono diverse banche dati di immagini che possono essere utilizzate a questo scopo, come le Basi di dati delle immagini delle cellule in microscopia, messe a disposizione dai vari istituti di ricerca nel campo della biologia.

Le reti neurali individuano patologie e fanno diagnosi personalizzate

Una rete neurale artificiale può sviluppare la capacità di riconoscere cellule, individuare patologie ed fare diagnosi personalizzate.

Gli algoritmi di apprendimento automatico analizzano il DNA presente in un campione prelevato dal paziente in modo da supportare i medici nella scelta di terapie personalizzate basate sulla specificità genetica del paziente.

L’AI può essere utilizzata per fare previsioni sul comportamento di un virus. Ad esempio, l’analisi di un vasto insieme di dati ottenuti da diverse fonti consentirà di riconoscere i pattern correlati al comportamento di un virus nel tempo. Tale analisi consente ai ricercatori di effettuare una stima quanto più accurata possibile sul futuro andamento della malattia.

Le reti neurali convoluzionali

Per quanto riguarda il riconoscimento delle cellule, ad esempio quelle colpite da un virus, è possibile utilizzare una rete neurale convoluzionale, il tipo di rete neurale utilizzata in applicazioni di riconoscimento di immagini, addestrata con un grande set di dati di immagini citologiche e istologiche di cellule sane e malate. La rete neurale convoluzionale identifica automaticamente le features rilevanti nelle immagini, come la forma e la struttura della cellula infetta da un virus, e può essere utilizzato per la classificazione di celle sane e malate e per la diagnosi precoce delle malattie.

Una rete neurale convoluzionale (CNN, dall’inglese Convolutional Neural Network) è un tipo di algoritmo di apprendimento automatico utilizzato per analizzare le immagini e riconoscere i modelli in esse presenti.

Le CNN sono composte da strati di neuroni artificiali, ognuno dei quali elabora stimoli provenienti dai neuroni del layer precedente. I layer interni alla CNN sono progettati per rilevare specifiche feature dell’immagine, ad esempio bordi, forme, texture, ecc., attraverso la convoluzione degli input dell’immagine ad intervalli regolari.

Gli strati finali della CNN sono progettati per elaborare le informazioni estratte dagli strati precedenti, producendo in output una classificazione o una predizione basata sull’immagine di input

Esempi concreti

Esaminiamo alcuni casi particolari tratti dalla documentazione scientifica che ci permettono di avere un’idea più chiara di come i sistemi di apprendimento automatico e, nello specifico, le reti neurali convoluzionali vengano utilizzati con profitto nella ricerca scientifica in generale e in quella medica in particolare.

In questo articolo del Nature Medicine del gennaio 2019 si presentano le tecniche di apprendimento profondo per l’assistenza sanitaria, incentrando la nostra discussione sull’apprendimento profondo nella visione artificiale, naturale, elaborazione del linguaggio, apprendimento per rinforzo e metodi generalizzati. Si descrive come queste tecniche computazionali possono avere un impatto su alcune aree chiave della medicina ed esplorare come costruire sistemi end-to-end. La discussione sulla visione artificiale si concentra in gran parte sull‘imaging medico e si descrive l’applicazione dell’elaborazione del linguaggio naturale a domini come la salute. Allo stesso modo, l’apprendimento per rinforzo è discusso nel contesto della chirurgia robotica assistita e vengono esaminati i metodi di apprendimento per la genomica…

Continua a leggere

Previsione della struttura proteica

Il lavoro di Senior et al. (2020) presenta un approccio basato sull’intelligenza artificiale per la previsione della struttura proteica.

La predizione della struttura proteica può essere utilizzata per determinare la forma tridimensionale di una proteina dalla sua sequenza amminoacidica. Questo problema è di fondamentale importanza in quanto la struttura di una proteina determina in gran parte la sua funzione. Le strutture proteiche possono essere difficili da determinare sperimentalmente. Recentemente sono stati compiuti notevoli progressi sfruttando le informazioni genetiche. È possibile dedurre quali residui amminoacidici sono in contatto analizzando la covariazione nelle sequenze omologhe, che aiuta nella predizione delle strutture proteiche.

Si può addestrare una rete neurale per fare previsioni accurate delle distanze tra coppie di residui, che trasmettono più informazioni sulla struttura rispetto alle previsioni di contatto. Usando queste informazioni, costruiamo un potenziale di forza media 4 che può descrivere con precisione la forma di una proteina…

Continua a leggere

Oltre la ricerca medica: Scoperta di nuovi pianeti

Il lavoro di Shallue e Vanderburg (2018) mostra come l’impiego di una rete neurale convoluzionale sia utile per individuare pianeti in orbita intorno a stelle simili al sole.

Il telescopio spaziale Kepler della NASA è stato progettato per determinare la frequenza dei pianeti delle dimensioni della Terra in orbita attorno a stelle simili al Sole, ma questi pianeti sono al limite della sensibilità di rilevamento della missione.
Determinare con precisione il tasso di occorrenza di questi pianeti richiederà automaticamente e con precisione valutare la probabilità che i singoli candidati siano effettivamente pianeti, anche a basso rapporto segnale-rumore. In questo lavoro si presenta un metodo per classificare potenziali segnali planetari utilizzando il deep learning, una classe di algoritmi di apprendimento automatico che sono recentemente diventati lo stato dell’arte in un’ampia varietà di attività. Si addestra una rete neurale convoluzionale profonda per prevedere se un dato segnale è un esopianeta in transito o un falso positivo causato da fenomeni astrofisici o strumentali. Il modello è altamente efficace a classificare i singoli candidati in base alla probabilità che siano davvero pianeti: il 98,8% delle volte classifica i segnali planetari plausibili superiori ai segnali falsi positivi nel nostro set di test. Si applica il modello a una nuova serie di segnali candidati che sono identificati in una ricerca sui noti sistemi multi-pianeta di Keplero. Si convalidano statisticamente due nuovi pianeti che sono identificati con alta sicurezza dal nostro modello. Uno di questi pianeti fa parte di una catena risonante di cinque pianeti attorno a Kepler-80, con un periodo orbitale molto vicino confrontando la previsione con relazioni di Laplace a tre corpi. L’altro pianeta orbita attorno a Kepler-90, una stella che in precedenza era nota per ospitare sette pianeti in transito. La scoperta di un ottavo pianeta porta Kepler-90 in pareggio con il nostro Sole come la stella nota per ospitare il maggior numero di pianeti.

Continua a leggere

Diagnosi dei tumori alla pelle

Il lavoro di Esteva et al. (2019) presenta un sistema di intelligenza artificiale basato su reti neurali profonde per la diagnosi di tumori della pelle.

Il cancro della pelle, il tumore maligno umano più comune viene diagnosticato principalmente visivamente, iniziando con uno screening clinico iniziale e seguito potenzialmente da un’analisi dermoscopica, una biopsia e un esame istopatologico. La classificazione automatizzata delle lesioni cutanee mediante immagini è un compito impegnativo a causa della variabilità a grana fine nell’aspetto delle lesioni cutanee. Le reti neurali convoluzionali profonde (CNN) mostrano il potenziale per compiti generali e altamente variabili in molte categorie di oggetti a grana fine. Si dimostra la classificazione delle lesioni cutanee utilizzando un singolo CNN, addestrato end-to-end direttamente dalle immagini, utilizzando solo pixel ed etichette di malattia come input. Formiamo una CNN utilizzando un set di dati di 129.450 immagini cliniche, due ordini di grandezza più grandi dei precedenti set di dati 12 , composto da 2.032 diverse malattie. Testiamo le sue prestazioni rispetto a 21 dermatologi certificati su immagini cliniche comprovate da biopsia con due casi d’uso di classificazione binaria critica: carcinomi dei cheratinociti rispetto a cheratosi seborroiche benigne; e melanomi maligni contro nevi benigni. Il primo caso rappresenta l’identificazione dei tumori più comuni, il secondo rappresenta l’identificazione del tumore della pelle più mortale. La CNN raggiunge prestazioni alla pari di tutti gli esperti testati in entrambi i compiti, dimostrando un’intelligenza artificiale in grado di classificare il cancro della pelle con un livello di competenza paragonabile ai dermatologi. Dotati di reti neurali profonde, i dispositivi mobili possono potenzialmente estendere la portata dei dermatologi al di fuori della clinica.

Continua a leggere

Sviluppo di nuove proteine

Questo lavoro mostra come sia possibile la progettazione di nuove proteine ​​tramite deep learning

Le proteine ​​con funzioni e proprietà desiderate sono importanti in campi come la nanotecnologia e la biomedicina. La progettazione di proteine ​​de novo consente la produzione di proteine ​​mai viste prima da zero ed è ritenuta un punto chiave per gestire le vere sfide sociali. La recente introduzione del deep learning nei metodi di progettazione mostra un’influenza trasformativa e dovrebbe rappresentare una direzione futura promettente ed entusiasmante. In questa recensione, si esaminano retrospettivamente i principali aspetti degli attuali progressi nelle procedure di progettazione basate sull’apprendimento profondo e si illustrano la loro novità rispetto agli approcci convenzionali basati sulla conoscenza attraverso casi notevoli. Non solo sidescrivono gli sviluppi dell’apprendimento profondo nella progettazione di proteine ​​​​basate sulla struttura e nella progettazione di sequenze dirette, ma si evidenziano anche le recenti applicazioni dell’apprendimento per rinforzo profondo nella progettazione di proteine. Vengono discusse in modo esauriente anche le prospettive future sugli obiettivi, le sfide e le opportunità di progettazione.

Continua a leggere