Identificazione di un percorso evolutivo nascosto tra due pieghe proteiche

Notizia

CasaCasa / Notizia / Identificazione di un percorso evolutivo nascosto tra due pieghe proteiche

Sep 10, 2023

Identificazione di un percorso evolutivo nascosto tra due pieghe proteiche

Nature Communications volume

Nature Communications volume 14, numero articolo: 3177 (2023) Citare questo articolo

317 accessi

15 Altmetrico

Dettagli sulle metriche

Sebbene si prevede che sequenze proteiche omologhe adottino strutture simili, alcune sostituzioni di amminoacidi possono interconvertire le eliche α e i fogli β. Tale ripiegamento potrebbe essersi verificato nel corso della storia evolutiva, ma le prove a sostegno sono state limitate da: (1) abbondanza e diversità dei geni sequenziati, (2) quantità di strutture proteiche determinate sperimentalmente e (3) ipotesi alla base dei metodi statistici utilizzati per dedurre l'omologia. Qui, superiamo queste barriere applicando più metodi statistici a una famiglia di circa 600.000 proteine ​​regolatrici della risposta batterica. Troviamo che le loro subunità omologhe che legano il DNA assumono strutture divergenti: elica-giro-elica contro α-elica + β-foglio (elica alata). Analisi filogenetiche, ricostruzione di sequenze ancestrali e modelli AlphaFold2 indicano che le sostituzioni di amminoacidi hanno facilitato il passaggio dall'elica-giro-elica all'elica alata. Questa trasformazione strutturale probabilmente ha ampliato la specificità di legame del DNA. Il nostro approccio scopre un percorso evolutivo tra due pieghe proteiche e fornisce una metodologia per identificare il passaggio della struttura secondaria in altre famiglie di proteine.

La vita è sostenuta dalle interazioni chimiche e dalle reazioni catalitiche di centinaia di milioni di proteine ​​ripiegate. Le strutture e le funzioni di queste proteine ​​sono determinate dalle loro sequenze di aminoacidi1. Pertanto, i cambiamenti nella sequenza hanno vari effetti funzionali, che vanno da nessuno a un danno intermedio fino alla perdita completa2,3, con esiti biologici che vanno da nessun effetto osservabile a una malattia debilitante4,5,6. Sebbene molti studi storici indichino che la variazione degli amminoacidi può sviluppare localmente o globalmente la struttura proteica7,8, tali cambiamenti in genere non rimodellano la struttura secondaria, come la conversione delle eliche α in fogli β. Questi risultati supportano l’osservazione ormai consolidata che le proteine ​​con sequenze simili hanno pieghe simili ed eseguono funzioni simili. A loro volta, queste somiglianze vengono utilizzate per classificare le pieghe proteiche in famiglie9,10,11 e sono alla base di metodi di previsione della struttura delle proteine ​​all'avanguardia12,13,14.

Tuttavia, lavori recenti mostrano che un sottoinsieme di cambiamenti di amminoacidi può cambiare la struttura secondaria. Questo processo è stato chiamato "metamorfosi evolutiva15" e "fold switching evoluto16". Ad esempio, la mutazione più frequente associata al linfoma non Hodgkin osservata nel fattore 2 di potenziamento dei micociti umani (MEF2) trasforma un'elica α C-terminale in un filamento β, probabilmente impedendo la funzione MEF217. Inoltre, numerose singole mutazioni disattivano l’orologio circadiano dei cianobatteri impedendo una trasformazione fondamentale per la sua normale funzione: il passaggio del suo sottodominio C-terminale da una piega βααβ a una piega αββα18. Infine, per una variante della proteina G ingegnerizzata, una singola mutazione o incorporazione in un dominio proteico più grande può cambiare il fascio di 3-α-elica che lega l'albumina sierica umana ad altre pieghe con funzioni alterate, come una piega α/β-grasp che lega le immunoglobuline o un dominio proteico ribosomiale α/β-treccia19,20,21,22,23.

Questi esempi suggeriscono che il ripiegamento evoluto delle strutture secondarie, attraverso cambiamenti graduali degli amminoacidi, può essere un meccanismo attraverso il quale i nuovi ripiegamenti proteici hanno origine in natura. Se è così, questo meccanismo evolutivo dovrebbe essere identificabile cercando sequenze proteiche omologhe con diverse strutture determinate sperimentalmente (Fig. 1a). Approcci simili hanno identificato con successo relazioni evolutive tra famiglie di ripiegamenti proteici con strutture secondarie conservate ma diverse disposizioni terziarie24,25.

a L'interrogazione dell'intera sequenza di FixJ (HTH4) rispetto al PDB con un round di BLAST ha prodotto una corrispondenza significativa con KdpE a lunghezza intera (wH). In particolare, in due regioni, sono state determinate sperimentalmente eliche α allineate con fogli β. b Una successiva ricerca PSI-BLAST ha confermato una probabile relazione evolutiva tra le sequenze FixJ e KdpE a lunghezza intera; le strutture a lunghezza intera sono mostrate con NTD conservati in grigio, linker in arancione, HTH4 CTD in nero e wH CTD in giallo. L'allineamento PSI-BLAST risultante include NTD e CTD (a partire da dove la sequenza KdpE è evidenziata in giallo); gli amminoacidi in grassetto sono identici (neri) o simili (grigi), le regioni in cui le eliche α si allineano con i filamenti β sono rosa; gli spazi vuoti sono indicati con '-'. c Regioni della struttura tridimensionale (a sinistra) e della struttura secondaria (a destra) in cui PSI-BLAST allinea le eliche α nella piega HTH4 con sequenze di filamento β nella piega wH (rosa). Le regioni grigie indicano la struttura secondaria e terziaria conservata; le regioni beige nel wH corrispondono ai suoi amminoacidi aggiuntivi nell'allineamento, indicati come spazi aperti nella struttura secondaria allineata di FixJ (a destra). I dati di origine vengono forniti come file di dati di origine.

1,000,000 diverse genes are present in the nr database, which is nearly 2 orders of magnitude larger than the NusG family mentioned before./p>