[ad_1]
I database di sequenze microbiche contengono numerose informazioni su enzimi e altre molecole che potrebbero essere adattate per la biotecnologia. Ma questi database sono diventati così grandi negli ultimi anni che è diventato difficile cercare in modo efficiente gli enzimi di interesse.
Ora, gli scienziati del McGovern Institute for Brain Research del MIT, del Broad Institute del MIT e di Harvard e del National Center for Biotechnology Information (NCBI) del National Institutes of Health hanno sviluppato un nuovo algoritmo di ricerca che ha identificato 188 tipi di nuovi rari sistemi CRISPR nei genomi batterici, che comprendono migliaia di sistemi individuali. L’opera appare oggi in Scienza.
L’algoritmo, che proviene dal laboratorio del pionieristico ricercatore CRISPR, il professor Feng Zhang, utilizza approcci di clustering di big data per cercare rapidamente enormi quantità di dati genomici. Il team ha utilizzato il proprio algoritmo, chiamato Fast Locality-Sensitive Hashing-based clustering (FLSHclust), per estrarre tre importanti database pubblici che contengono dati provenienti da una vasta gamma di batteri insoliti, compresi quelli trovati nelle miniere di carbone, nei birrifici, nei laghi antartici e nella saliva dei cani. . Gli scienziati hanno scoperto un numero e una diversità sorprendenti di sistemi CRISPR, compresi quelli che potrebbero apportare modifiche al DNA nelle cellule umane, altri che possono prendere di mira l’RNA e molti con una varietà di altre funzioni.
I nuovi sistemi potrebbero potenzialmente essere sfruttati per modificare le cellule dei mammiferi con meno effetti fuori bersaglio rispetto agli attuali sistemi Cas9. Un giorno potrebbero anche essere usati come strumenti diagnostici o servire come registrazioni molecolari dell’attività all’interno delle cellule.
I ricercatori affermano che la loro ricerca evidenzia un livello senza precedenti di diversità e flessibilità di CRISPR e che probabilmente ci sono molti altri sistemi rari ancora da scoprire poiché i database continuano a crescere.
“La biodiversità è un vero tesoro e, mentre continuiamo a sequenziare più genomi e campioni metagenomici, c’è una crescente necessità di strumenti migliori, come FLSHclust, per cercare nello spazio di sequenza per trovare le gemme molecolari”, afferma Zhang, un co-professionista. autore senior dello studio e James e Patricia Poitras Professori di Neuroscienze al MIT con incarichi congiunti nei dipartimenti di Scienze del cervello e cognitive e di Ingegneria biologica. Zhang è anche un ricercatore presso il McGovern Institute for Brain Research del MIT, un membro dell’istituto principale del Broad e un ricercatore presso l’Howard Hughes Medical Institute. Eugene Koonin, un illustre ricercatore dell’NCBI, è anche co-autore senior dello studio.
Alla ricerca di CRISPR
CRISPR, che sta per brevi ripetizioni palindromiche raggruppate e interspaziate regolarmente, è un sistema di difesa batterica che è stato integrato in molti strumenti per l’editing e la diagnostica del genoma.
Per estrarre database di sequenze di proteine e acidi nucleici per nuovi sistemi CRISPR, i ricercatori hanno sviluppato un algoritmo basato su un approccio preso in prestito dalla comunità dei big data. Questa tecnica, chiamata hashing sensibile alla località, raggruppa oggetti simili ma non esattamente identici. L’utilizzo di questo approccio ha permesso al team di sondare miliardi di proteine e sequenze di DNA – dall’NCBI, dal suo database Whole Genome Shotgun e dal Joint Genome Institute – in settimane, mentre i metodi precedenti che cercavano oggetti identici avrebbero richiesto mesi. Hanno progettato il loro algoritmo per cercare i geni associati a CRISPR.
“Questo nuovo algoritmo ci consente di analizzare i dati in un arco di tempo sufficientemente breve da poter effettivamente recuperare i risultati e formulare ipotesi biologiche”, afferma Soumya Kannan PhD ’23, co-primo autore dello studio. Kannan era uno studente laureato nel laboratorio di Zhang quando è iniziato lo studio ed è attualmente un postdoc e Junior Fellow presso l’Università di Harvard. Han Altae-Tran PhD ’23, uno studente laureato nel laboratorio di Zhang durante lo studio e attualmente postdoc presso l’Università di Washington, è stato l’altro co-primo autore dello studio.
“Questa è una testimonianza di ciò che si può fare quando si migliorano i metodi di esplorazione e si utilizzano quanti più dati possibile”, afferma Altae-Tran. “È davvero entusiasmante poter migliorare la scala su cui effettuiamo le nostre ricerche.”
Nuovi sistemi
Nella loro analisi, Altae-Tran, Kannan e i loro colleghi hanno notato che le migliaia di sistemi CRISPR che hanno trovato rientravano in alcune categorie esistenti e in molte nuove. Hanno studiato molti dei nuovi sistemi in modo più dettagliato in laboratorio.
Hanno trovato diverse nuove varianti dei noti sistemi CRISPR di tipo I, che utilizzano un RNA guida lungo 32 paia di basi anziché la guida a 20 nucleotidi di Cas9. A causa dei loro RNA guida più lunghi, questi sistemi di tipo I potrebbero essere potenzialmente utilizzati per sviluppare una tecnologia di editing genetico più precisa e meno incline all’editing fuori bersaglio. Il team di Zhang ha dimostrato che due di questi sistemi potrebbero apportare brevi modifiche al DNA delle cellule umane. E poiché questi sistemi di tipo I sono di dimensioni simili a CRISPR-Cas9, potrebbero probabilmente essere consegnati alle cellule di animali o esseri umani utilizzando le stesse tecnologie di consegna genetica utilizzate oggi per CRISPR.
Uno dei sistemi di tipo I ha mostrato anche “attività collaterale”: un’ampia degradazione degli acidi nucleici dopo che la proteina CRISPR si è legata al suo bersaglio. Gli scienziati hanno utilizzato sistemi simili per effettuare la diagnostica delle malattie infettive come SHERLOCK, uno strumento in grado di rilevare rapidamente una singola molecola di DNA o RNA. Il team di Zhang ritiene che i nuovi sistemi potrebbero essere adattati anche alle tecnologie diagnostiche.
I ricercatori hanno anche scoperto nuovi meccanismi d’azione per alcuni sistemi CRISPR di tipo IV e un sistema di tipo VII che prende di mira precisamente l’RNA, che potrebbe essere potenzialmente utilizzato nell’editing dell’RNA. Altri sistemi potrebbero essere potenzialmente utilizzati come strumenti di registrazione – un documento molecolare di quando un gene è stato espresso – o come sensori di attività specifica in una cellula vivente.
Dati minerari
Gli scienziati affermano che il loro algoritmo potrebbe aiutare nella ricerca di altri sistemi biochimici. “Questo algoritmo di ricerca potrebbe essere utilizzato da chiunque desideri lavorare con questi grandi database per studiare come si evolvono le proteine o scoprire nuovi geni”, afferma Altae-Tran.
I ricercatori aggiungono che i loro risultati illustrano non solo quanto siano diversi i sistemi CRISPR, ma anche che la maggior parte sono rari e si trovano solo in batteri insoliti. “Alcuni di questi sistemi microbici sono stati trovati esclusivamente nell’acqua delle miniere di carbone”, afferma Kannan. “Se qualcuno non fosse stato interessato a questo, forse non avremmo mai visto quei sistemi. Ampliare la nostra diversità di campionamento è davvero importante per continuare ad espandere la diversità di ciò che possiamo scoprire”.
Questo lavoro è stato sostenuto dall’Howard Hughes Medical Institute; il Centro di terapia molecolare K. Lisa Yang e Hock E. Tan al MIT; Donatori di doni di terapia programmabile del Broad Institute; La Fondazione Pershing Square, William Ackman e Neri Oxman; James e Patricia Poitras; Fondazione di beneficenza BT; Fondazione Famiglia Asness; Kenneth C.Griffin; la famiglia Phillips; David Cheng; e Robert Metcalfe.
[ad_2]
Source link