[ad_1]
Una strategia per la riprogrammazione cellulare prevede l’utilizzo di interventi genetici mirati per ingegnerizzare una cellula in un nuovo stato. La tecnica è molto promettente nell’immunoterapia, ad esempio, dove i ricercatori potrebbero riprogrammare le cellule T di un paziente in modo che siano più potenti killer del cancro. Un giorno, l’approccio potrebbe anche aiutare a identificare trattamenti contro il cancro salvavita o terapie rigenerative che riparano gli organi devastati dalla malattia.
Ma il corpo umano ha circa 20.000 geni e una perturbazione genetica potrebbe riguardare una combinazione di geni o uno qualsiasi degli oltre 1.000 fattori di trascrizione che regolano i geni. Poiché lo spazio di ricerca è vasto e gli esperimenti genetici sono costosi, gli scienziati spesso hanno difficoltà a trovare la perturbazione ideale per la loro particolare applicazione.
I ricercatori del MIT e dell’Università di Harvard hanno sviluppato un nuovo approccio computazionale in grado di identificare in modo efficiente le perturbazioni genetiche ottimali sulla base di un numero molto inferiore di esperimenti rispetto ai metodi tradizionali.
La loro tecnica algoritmica sfrutta la relazione di causa-effetto tra fattori in un sistema complesso, come la regolazione del genoma, per dare priorità al miglior intervento in ogni ciclo di esperimenti sequenziali.
I ricercatori hanno condotto una rigorosa analisi teorica per determinare che la loro tecnica identificasse effettivamente gli interventi ottimali. Con questo quadro teorico in atto, hanno applicato gli algoritmi a dati biologici reali progettati per imitare un esperimento di riprogrammazione cellulare. I loro algoritmi erano i più efficienti ed efficaci.
“Troppo spesso gli esperimenti su larga scala sono progettati empiricamente. Un attento quadro causale per la sperimentazione sequenziale può consentire di identificare interventi ottimali con meno prove, riducendo così i costi sperimentali”, afferma la co-autrice senior Caroline Uhler, professoressa presso il Dipartimento di Ingegneria Elettrica e Informatica (EECS) che è anche co-direttrice dell’Eric and Wendy Schmidt Center presso il Broad Institute del MIT e di Harvard, e ricercatore presso il Laboratory for Information and Decision Systems (LIDS) e l’Institute for Data, Systems and Society (IDSS) del MIT.
Unendo Uhler sul giornale, che appare oggi in Intelligenza artificiale della natura, sono l’autore principale Jiaqi Zhang, uno studente laureato e membro del Centro Eric e Wendy Schmidt; il co-autore senior Themistoklis P. Sapsis, professore di ingegneria meccanica e oceanica al MIT e membro dell’IDSS; e altri ad Harvard e al MIT.
Apprendimento attivo
Quando gli scienziati cercano di progettare un intervento efficace per un sistema complesso, come nella riprogrammazione cellulare, spesso eseguono esperimenti in sequenza. Tali impostazioni sono ideali per l’utilizzo di un approccio di apprendimento automatico chiamato apprendimento attivo. Campioni di dati vengono raccolti e utilizzati per apprendere un modello del sistema che incorpori le conoscenze raccolte finora. Da questo modello viene progettata una funzione di acquisizione, un’equazione che valuta tutti i potenziali interventi e sceglie quello migliore da testare nella sperimentazione successiva.
Questo processo viene ripetuto finché non viene identificato un intervento ottimale (o fino all’esaurimento delle risorse per finanziare gli esperimenti successivi).
«Sebbene esistano diverse funzioni di acquisizione generiche per progettare esperimenti in sequenza, queste non sono efficaci per problemi di tale complessità, portando a una convergenza molto lenta», spiega Sapsis.
Le funzioni di acquisizione in genere considerano la correlazione tra fattori, ad esempio quali geni sono co-espressi. Ma concentrarsi solo sulla correlazione ignora le relazioni normative o la struttura causale del sistema. Ad esempio, un intervento genetico può influenzare solo l’espressione dei geni a valle, ma un approccio basato sulla correlazione non sarebbe in grado di distinguere tra geni a monte o a valle.
“Puoi apprendere parte di questa conoscenza causale dai dati e utilizzarla per progettare un intervento in modo più efficiente”, spiega Zhang.
I ricercatori del MIT e di Harvard hanno sfruttato questa struttura causale sottostante per la loro tecnica. Innanzitutto, hanno costruito attentamente un algoritmo in modo che possa apprendere solo modelli del sistema che tengono conto delle relazioni causali.
Successivamente i ricercatori hanno progettato la funzione di acquisizione in modo che valuti automaticamente gli interventi utilizzando le informazioni su queste relazioni causali. Hanno creato questa funzione in modo che dia la priorità agli interventi più informativi, ovvero quelli che con maggiore probabilità porteranno all’intervento ottimale negli esperimenti successivi.
“Considerando modelli causali invece di modelli basati sulla correlazione, possiamo già escludere alcuni interventi. Quindi, ogni volta che si ottengono nuovi dati, è possibile apprendere un modello causale più accurato e quindi ridurre ulteriormente lo spazio di intervento”, spiega Uhler.
Questo spazio di ricerca più piccolo, unito alla particolare attenzione della funzione di acquisizione agli interventi più informativi, è ciò che rende il loro approccio così efficiente.
I ricercatori hanno ulteriormente migliorato la loro funzione di acquisizione utilizzando una tecnica nota come ponderazione dell’output, ispirata allo studio degli eventi estremi nei sistemi complessi. Questo metodo enfatizza attentamente gli interventi che probabilmente si avvicinano all’intervento ottimale.
“Essenzialmente, consideriamo un intervento ottimale come un ‘evento estremo’ nell’ambito di tutti gli interventi possibili e subottimali e utilizziamo alcune delle idee che abbiamo sviluppato per questi problemi”, afferma Sapsis.
Efficienza migliorata
Hanno testato i loro algoritmi utilizzando dati biologici reali in un esperimento simulato di riprogrammazione cellulare. Per questo test, hanno cercato una perturbazione genetica che avrebbe comportato uno spostamento desiderato nell’espressione genetica media. Le loro funzioni di acquisizione hanno costantemente identificato interventi migliori rispetto ai metodi di base in ogni fase dell’esperimento in più fasi.
“Se interrompessimo l’esperimento in qualsiasi momento, il nostro sarebbe comunque più efficiente rispetto alle linee di base. Ciò significa che potresti eseguire meno esperimenti e ottenere risultati uguali o migliori”, afferma Zhang.
I ricercatori stanno attualmente lavorando con sperimentali per applicare la loro tecnica alla riprogrammazione cellulare in laboratorio.
Il loro approccio potrebbe essere applicato anche a problemi esterni alla genomica, come l’identificazione dei prezzi ottimali per i prodotti di consumo o l’abilitazione di un controllo ottimale del feedback nelle applicazioni di meccanica dei fluidi.
In futuro, intendono migliorare la loro tecnica di ottimizzazione oltre a quelle che cercano di raggiungere la media desiderata. Inoltre, il loro metodo presuppone che gli scienziati comprendano già le relazioni causali nel loro sistema, ma il lavoro futuro potrebbe esplorare come utilizzare l’intelligenza artificiale anche per apprendere tali informazioni.
Questo lavoro è stato finanziato, in parte, dall’Office of Naval Research, dal MIT-IBM Watson AI Lab, dal MIT J-Clinic for Machine Learning and Health, dall’Eric and Wendy Schmidt Center presso il Broad Institute, da un Simons Investigator Award, l’Ufficio per la ricerca scientifica dell’aeronautica militare e una borsa di studio per laureati della National Science Foundation.
[ad_2]
Source link