Δευτεροταγής δομή πρωτεΐνης

Από testwiki
Αναθεώρηση ως προς 13:25, 12 Δεκεμβρίου 2024 από τον imported>InternetArchiveBot (Προσθήκη 1 βιβλίου για Επαληθευσιμότητα (20241211sim)) #IABot (v2.0.9.5) (GreenC bot)
(διαφορά) ← Παλαιότερη αναθεώρηση | Τελευταία αναθεώρηση (διαφορά) | Νεότερη αναθεώρηση → (διαφορά)
Μετάβαση στην πλοήγηση Πήδηση στην αναζήτηση

Δευτεροταγής δομή πρωτεΐνης είναι η τρισδιάστατη μορφή των τοπικών τμημάτων της πρωτεΐνης. Τα δύο πιο συνηθισμένα δευτεροταγή δομικά στοιχεία είναι οι άλφα έλικες και τα φύλλα βήτα, αν και εμφανίζονται επίσης στροφές βήτα και βρόχοι ωμέγα. Τα στοιχεία δευτεροταγούς δομής τυπικά σχηματίζονται αυθόρμητα ως ενδιάμεσα πριν από τις πτυχώσεις της πρωτεΐνης στην τρισδιάστατη τριτοταγή δομή.

Η δευτεροταγής δομή ορίζεται επίσημα από το σχήμα των δεσμών υδρογόνου μεταξύ των ατόμων υδρογόνου της αμίνης και του καρβοξυλικού οξυγόνου στο πεπτίδιο σκελετού. Η δευτεροταγής δομή μπορεί εναλλακτικά να οριστεί με βάση το κανονικό μοτίβο των διεδρικών γωνιών του κορμού σε μια συγκεκριμένη περιοχή του σχεδίου Ramachandran ανεξάρτητα από το αν έχει τους σωστούς δεσμούς υδρογόνου.

Η έννοια της δευτεροταγούς δομής παρουσιάστηκε για πρώτη φορά από τον Kaj Ulrik Linderstrøm-Lang στο Stanford το 1952. .[1][2] Άλλοι τύποι βιοπολυμερών όπως τα νουκλεϊκά οξέα διαθέτουν επίσης χαρακτηριστικές δευτεροταγείς δομές.

Τύποι

Δομικά χαρακτηριστικά των τριών κύριων μορφών ελίκων πρωτεϊνών [3][4]
Γεωμετρικό χαρακτηριστικό α-έλικα 310 έλικα π-έλικα
Υπολείμματα ανά στροφή 3.6 3.0 4.4
Μετάφραση ανά υπόλειμμα Πρότυπο:Convert Πρότυπο:Convert Πρότυπο:Convert
Ακτίνα έλικας Πρότυπο:Convert Πρότυπο:Convert Πρότυπο:Convert
Βήμα Πρότυπο:Convert Πρότυπο:Convert Πρότυπο:Convert

Οι πιο κοινές δευτερεύουσες δομές είναι οι άλφα έλικες και τα φύλλα βήτα. Άλλες έλικες, όπως η 310 έλικα και η π έλικα, υπολογίζεται ότι έχουν ενεργητικά ευνοϊκά πρότυπα σύνδεσης υδρογόνου αλλά σπάνια παρατηρούνται σε φυσικές πρωτεΐνες εκτός από τα άκρα των α ελίκων λόγω δυσμενούς συσκευασίας σκελετού στο κέντρο της έλικας. Άλλες εκτεταμένες δομές όπως η έλικα πολυπρολίνης και φύλλο άλφα είναι σπάνιες σε πρωτεΐνες σε φυσική κατάσταση, αλλά συχνά θεωρούνται σημαντικά ενδιάμεσα αναδίπλωσης πρωτεΐνης. Σφιχτές στροφές και χαλαροί, εύκαμπτοι βρόχοι συνδέουν τα πιο "κανονικά" δευτερεύοντα δομικά στοιχεία. Η τυχαία σπείρα δεν είναι μια πραγματική δευτεροταγής δομή, αλλά είναι η τάξη των διαμορφώσεων που υποδηλώνουν την απουσία κανονικής δευτεροταγούς δομής. Τα αμινοξέα ποικίλλουν στην ικανότητά τους να σχηματίζουν τα διάφορα δευτεροταγή δομικά στοιχεία. Η προλίνη και η γλυκίνη είναι μερικές φορές γνωστές ως διακόπτες έλικας επειδή διαταράσσουν την κανονικότητα της διαμόρφωσης του ελικοειδούς σκελετού. Ωστόσο, και οι δύο έχουν ασυνήθιστες διαμορφωτικές ικανότητες και συνήθως βρίσκονται στις στροφές. Τα αμινοξέα που προτιμούν να υιοθετήσουν ελικοειδείς διαμορφώσεις σε πρωτεΐνες περιλαμβάνουν μεθειονίνη, αλανίνη, λευκίνη, γλουταμινικό οξύ και λυσίνη ("MALEK "σε αμινοξέα με κωδικούς 1 γράμματος). Αντίθετα, τα μεγάλα αρωματικά υπολείμματα (τρυπτοφάνη, τυροσίνη και φαινυλαλανίνη) και τα Cβ -διακλαδισμένα αμινοξέα (ισολευκίνη, βαλίνη και θρεονίνη) προτιμούν να υιοθετούν διαμορφώσεις φύλλου βήτα. Ωστόσο, αυτές οι προτιμήσεις δεν είναι αρκετά ισχυρές ώστε να παράγουν μια αξιόπιστη μέθοδο πρόβλεψης δευτεροταγούς δομής μόνο από την αλληλουχία. Οι συλλογικές δονήσεις χαμηλής συχνότητας πιστεύεται ότι είναι ευαίσθητες στην τοπική ακαμψία εντός των πρωτεϊνών, αποκαλύπτοντας ότι οι δομές βήτα είναι γενικά πιο άκαμπτες από τις άλφα ή από διαταραγμένες πρωτεΐνες.[5][6] Οι μετρήσεις σκέδασης νετρονίων έχουν συνδέσει άμεσα το φασματικό χαρακτηριστικό στα ~ 1 THz με συλλογικές κινήσεις της δευτεροταγούς δομής της πρωτεΐνης GFP β-βαρελιού. .[7]

Τα πρότυπα σύνδεσης υδρογόνου σε δευτεροταγείς δομές μπορεί να παραμορφωθούν σημαντικά, γεγονός που καθιστά δύσκολο τον αυτόματο προσδιορισμό της δευτεροταγούς δομής. Υπάρχουν διάφορες μέθοδοι για τον επίσημο ορισμό της δευτεροταγούς δομής πρωτεΐνης (π.χ. DSSP)[8] DEFINE,[9] STRIDE,[10] ScrewFit,[11] SST[12]).

Ταξινόμηση DSSP

Κατανομή που ελήφθη από μη πλεονάζων σύνολο δεδομένων pdb_select (Μάρτιος 2006). Η δευτεροταγής δομή που έχει εκχωρηθεί από το DSSP, οι 8 καταστάσεις διαμόρφωσης μειώθηκαν σε 3 καταστάσεις: H = HGI, E = EB, C = STC. Ορατά είναι μίγματα κατανομών (Γκάους) διανομών, που προκύπτουν επίσης από τη μείωση των καταστάσεων DSSP.

Το Λεξικό Πρωτεϊνικής Δευτεροταγούς Δομής, εν συντομία DSSP, χρησιμοποιείται συνήθως για την περιγραφή της δευτεροταγούς δομής πρωτεΐνης με κωδικούς ενός γράμματος. Η δευτεροταγής δομή εκχωρείται με βάση τα πρότυπα σύνδεσης υδρογόνου όπως αυτά που προτάθηκαν αρχικά από τους Pauling κ.α. το 1951 (πριν από οποιαδήποτε πειραματική δομή πρωτεϊνικής δομής). Υπάρχουν οκτώ τύποι δευτεροταγούς δομής που ορίζει το DSSP:

  • G = Έλικα 3 στροφών (310 έλικα). Ελάχιστο μήκος 3 υπολειμμάτων.
  • H = Έλικα 4 στροφών (άλφα έλικα). Ελάχιστο μήκος 4 υπολειμμάτων.
  • I = Έλικα 5 στροφών (π έλικα). Ελάχιστο μήκος 5 υπολειμμάτων.
  • T = στροφή με δεσμό υδρογόνου (3, 4 ή 5 στροφές)
  • E = εκτεταμένη αλυσίδα σε παράλληλη και/ή αντι-παράλληλη διαμόρφωση β-φύλλου. Ελάχιστο μήκος 2 υπολειμμάτων.
  • B = υπόλειμμα σε απομονωμένη β-γέφυρα (σχηματισμός δεσμού υδρογόνου ενός ζεύγους φύλλου β.
  • S = κάμψη (ο μοναδικός δεσμός μη υδρογόνου με βάση την απόδοση).
  • C = έλικα (υπολείματα που δεν βρίσκονται σε καμία από τις παραπάνω διαμορφώσεις).

H "σπείρα" κωδικοποιείται συχνά ως ' ' (διάστημα), C (coil-σπείρα) ή '–' (παύλα). Οι διαμορφώσεις ελικών (G, H και I) και φύλλων πρέπει να έχουν όλες εύλογο μέγεθος. Αυτό σημαίνει ότι 2 γειτονικά υπολείμματα στην πρωτοταγή δομή πρέπει να σχηματίζουν το ίδιο μοτίβο δεσμού υδρογόνου. Εάν το μοτίβο δεσμού υδρογόνου έλικας ή φύλλου είναι πολύ μικρό, χαρακτηρίζονται ως Τ ή Β, αντίστοιχα Υπάρχουν και άλλες κατηγορίες εκχώρησης δευτεροταγούς δομής πρωτεΐνης (αιχμηρές στροφές, ωμέγα βρόχοι κ.λπ.), αλλά χρησιμοποιούνται λιγότερο συχνά.

Η δευτεροταγής δομή ορίζεται με δεσμούς υδρογόνου, οπότε ο ακριβής ορισμός ενός δεσμού υδρογόνου είναι κρίσιμος. Ο τυπικός ορισμός δεσμού υδρογόνου για τη δευτεροταγή δομή είναι αυτός του DSSP, που είναι ένα καθαρά ηλεκτροστατικό πρότυπο. Εκχωρεί φορτία ± "q"1  ≈ 0,42"e" " στον καρβονυλικό άνθρακα και στο οξυγόνο, αντίστοιχα, και φορτία ±q2  ≈  0,20 "e" στο αμιδικό υδρογόνο και άζωτο, αντίστοιχα. Η ηλεκτροστατική ενέργεια είναι

E=q1q2(1rON+1rCH1rOH1rCN)332 kcal/mol.

Σύμφωνα με το DSSP, ένας δεσμός υδρογόνου υπάρχει εάν και μόνο εάν το "E" είναι μικρότερο από Πρότυπο:Cvt. Αν και ο τύπος DSSP είναι μια σχετικά χοντρική προσέγγιση της φυσικής ενέργειας δεσμού υδρογόνου, είναι γενικά αποδεκτή ως εργαλείο για τον ορισμό της δευτεροταγούς δομής.

Ταξινόμηση SST[12]

Η SST είναι μια μέθοδος Μπέυζ (Bayes) για την εκχώρηση δευτεροταγούς δομής σε δεδομένα συντεταγμένων πρωτεϊνών χρησιμοποιώντας το κριτήριο πληροφοριών Shannon για το συμπέρασμα του ελάχιστου μέγεθος μηνύματος (MML)). SST αντιμετωπίζει οποιαδήποτε ανάθεση δευτεροταγούς δομής ως μια πιθανή υπόθεση που επιχειρεί να εξηγήσει τη συμπίεση δεδομένων συντεταγμένων πρωτεΐνης. Η βασική ιδέα είναι ότι η άριστη δευτεροταγής δομική ανάθεση είναι αυτή που μπορεί να εξηγήσει τη συμπίεση των συντεταγμένων μιας δεδομένης πρωτεΐνης με τον πιο οικονομικό τρόπο, έτσι που συνδέει το συμπέρασμα της δευτεροταγούς δομής με συμπίεση δεδομένων χωρίς απώλειες. Το SST περιγράφει με ακρίβεια οποιαδήποτε πρωτεϊνική αλυσίδα σε περιοχές που σχετίζονται με τους ακόλουθους τύπους ανάθεσης: [13]

  • E = (Εκτεταμένη) αλυσίδα β-πτυχωτό φύλλο
  • G = Δεξιόστροφη 310 έλικα
  • H = Δεξιόστροφη α-έλικα
  • I = Δεξιόστροφη π-έλικα
  • g = Αριστερόστροφη 310 έλικα
  • h = Αριστερόστροφη α-έλικα
  • i = Αριστερόστροφη π-έλικα
  • 3 = παρόμοια με 310 στροφή
  • 4 = παρόμοια με α στροφή
  • 5 = παρόμοια με π- στροφή
  • T = Αδιάθετη στροφή
  • C = Σπείρα
  • - = Αδιάθετο υπόλειμμα

SST εντοπίζει π και 310 ελικοειδή καλύμματα στις πρότυπες α-έλικες και συναρμολογεί αυτόματα τους διάφορους εκτεταμένους κλώνους σε σταθερά β-πτυχωμένα . φύλλα Παρέχει μια ευανάγνωστη έξοδο των τεμαχισμένων δευτεροταγών δομικών στοιχείων, και μια αντίστοιχη δέσμη ενεργειών PyMol με δυνατότητα φόρτωσης για την απεικόνιση των εκχωρημένων δευτεροταγών δομικών στοιχείων ξεχωριστά.

Πειραματικός προσδιορισμός

Το χοντρικό περιεχόμενο δευτεροταγούς δομής ενός βιοπολυμερούς (π.χ., αυτή η πρωτεΐνη είναι 40% α-έλικα και 20% β-φύλλο μπορεί να εκτιμηθεί φασματοσκοπικά. [14] Για τις πρωτεΐνες, μια κοινή μέθοδος είναι η άπω υπεριώδης ακτινοβολία (far-UV, 170–250 nm) κυκλικού διχρωισμού. Ένα έντονο διπλό ελάχιστο στα 208 και 222 nm δείχνει α-ελικοειδή δομή, ενώ ένα μοναδικό ελάχιστο στα 204 nm ή 217 nm αντικατοπτρίζει τη δομή τυχαίας σπείρας ή β-φύλλου, αντίστοιχα. Μια λιγότερο συνηθισμένη μέθοδος είναι η φασματοσκοπία υπερύθρου, η οποία ανιχνεύει διαφορές στις ταλαντώσεις του δεσμού των αμιδικών ομάδων λόγω των δεσμών υδρογόνου. Τέλος, τα περιεχόμενα δευτεροταγούς δομής μπορούν να εκτιμηθούν με ακρίβεια χρησιμοποιώντας τις χημικές μετατοπίσεις του αρχικά μη εκχωρημένου φάσματος NMR. [15]

Πρόβλεψη

Η πρόβλεψη της τριτοταγούς δομής της πρωτεΐνης μόνο από την αμινοαλληλουχία της είναι ένα πολύ δύσκολο πρόβλημα, αλλά η χρήση των απλούστερων ορισμών δευτεροταγούς δομής είναι πιο ανιχνεύσιμη.

Οι πρώιμες μέθοδοι πρόβλεψης δευτερογενούς δομής περιορίστηκαν στην πρόβλεψη των τριών κυρίαρχων καταστάσεων: έλικα, φύλλο ή τυχαίο σπείρωμα. Αυτές οι μέθοδοι βασίστηκαν στις τάσεις σχηματισμού έλικας ή φύλλου μεμονωμένων αμινοξέων, μερικές φορές σε συνδυασμό με κανόνες για την εκτίμηση της ελεύθερης ενέργειας σχηματισμού δευτεροταγών δομών. Οι πρώτες ευρέως χρησιμοποιούμενες τεχνικές για την πρόβλεψη της δευτεροταγούς δομής της πρωτεΐνης από την αλληλουχία αμινοξέων ήταν η μέθοδος Chou-Fasman[16][17][18] και η μέθοδος GOR.[19] Αν και τέτοιες μέθοδοι ισχυρίστηκαν ότι επιτυγχάνουν ~60% ακρίβεια στην πρόβλεψη ποια από τις τρεις καταστάσεις (έλικα/φύλλο/σπείρωμα) υιοθετεί ένα υπόλειμμα, οι τυφλές υπολογιστικές αξιολογήσεις αργότερα έδειξαν ότι η πραγματική ακρίβεια ήταν πολύ χαμηλότερη.[20]

Μια σημαντική αύξηση της ακρίβειας (σε περίπου ~80%) έγινε με την εκμετάλλευση της πολλαπλής στοίχισης αλληλουχιών. Η γνώση της πλήρους κατανομής των αμινοξέων που εμφανίζονται σε μια θέση (και στην περιοχή της, συνήθως ~7 υπολείμματα και στις δύο πλευρές) σε όλη την εξέλιξη παρέχει μια πολύ καλύτερη εικόνα των δομικών τάσεων κοντά σε αυτήν τη θέση.[21][22] Παραδείγματος χάρη, μια δεδομένη πρωτεΐνη μπορεί να έχει γλυκίνη σε μια δεδομένη θέση, η οποία από μόνη της μπορεί να προτείνει ένα τυχαίο σπείρωμα εκεί. Ωστόσο, η πολλαπλή στοίχιση αλληλουχιών μπορεί να αποκαλύψει ότι τα αμινοξέα που ευνοούν την έλικα εμφανίζονται σε αυτήν τη θέση (και σε κοντινές θέσεις) στο 95% των ομόλογων πρωτεϊνών που εκτείνονται σε σχεδόν ένα δισεκατομμύριο χρόνια εξέλιξης. Επιπλέον, εξετάζοντας τον μέσο όρο υδροφοβικότητας σε εκείνες και τις γειτονικές θέσεις, η ίδια στοίχιση μπορεί επίσης να υποδηλώνει ένα πρότυπο υπολείμματος προσβασιμότητας διαλυτών που είναι σύμφωνο με μια α-έλικα. Συνολικά, αυτοί οι παράγοντες υποδηλώνουν ότι η γλυκίνη της αρχικής πρωτεΐνης υιοθετεί α-ελικοειδή δομή, παρά τυχαίο σπείρωμα. Χρησιμοποιούνται διάφοροι τύποι μεθόδων για να συνδυάσουν όλα τα διαθέσιμα δεδομένα για να σχηματίσουν μια πρόβλεψη των 3 καταστάσεων, όπως νευρωνικά δίκτυα, τα κρυφά πρότυπα Markov και οι μηχανές υποστήριξης φορέα. Οι σύγχρονες μέθοδοι πρόβλεψης παρέχουν επίσης αξιολόγηση εμπιστοσύνης για τις προβλέψεις τους σε κάθε θέση.

Οι μέθοδοι πρόβλεψης δευτεροταγούς δομής αξιολογήθηκαν με τα πειράματα Critical Assessment of protein Structure Prediction (CASP) και συνεχώς συγκρίνονταν, π.χ. από τη μέτρηση επιδόσεων EVA. Με βάση αυτές τις δοκιμές, οι πιο ακριβείς μέθοδοι ήταν οι Psipred, SAM,[23] PORTER,[24] PROF,[25] και SABLE.[26] Ο κύριος τομέας βελτίωσης φαίνεται να είναι η πρόβλεψη των β-αλυσίδων. Υπολείμματα που προβλέπονται με βεβαιότητα ως β-αλυσίδες είναι πιθανό να είναι έτσι, αλλά οι μέθοδοι είναι επιρρεπείς στην παράβλεψη ορισμένων τμημάτων β-αλυσίδας (ψευδώς αρνητικές). Υπάρχει πιθανότατα ένα ανώτερο όριο ακρίβειας πρόβλεψης ~ 90% συνολικά, λόγω των ιδιοσυγκρασιών της τυπικής μεθόδου (DSSP) για την εκχώρηση κλάσεων δευτεροταγούς δομής (έλικα/αλυσίδα/σπείρωμα) σε δομές PDB, έναντι των οποίων οι προβλέψεις αξιολογούνται.[27]

Η ακριβής πρόβλεψη δευτεροταγούς δομής είναι ένα βασικό στοιχείο στην πρόβλεψη της τριτοταγούς δομής, σε όλες τις περιπτώσεις εκτός από τις απλούστερες περιπτώσεις. Παραδείγματος χάρη, ένα βέβαιο προβλεπόμενο μοτίβο έξι δευτερευόντων στοιχείων δομής βαββαβ είναι η υπογραφή μιας πτύχωσης της φερεδοξίνης.[28]

Εφαρμογές

Τόσο οι δευτεροταγείς δομές πρωτεΐνης όσο και νουκλεϊκού οξέος μπορούν να χρησιμοποιηθούν για να βοηθήσουν στην πολλαπλή στοίχιση αλληλουχιών. Αυτές οι στοιχίσεις μπορούν να γίνουν πιο ακριβείς με τη συμπερίληψη πληροφοριών δευτεροταγούς δομής εκτός από απλές πληροφορίες αλληλουχιών. Αυτό μερικές φορές είναι λιγότερο χρήσιμο στο RNA επειδή το ζεύγος βάσεων είναι πολύ πιο συντηρημένο από την αλληλουχία. Μακρινές σχέσεις μεταξύ πρωτεϊνών των οποίων οι πρωτοταγείς δομές δεν στοιχίζονται μπορεί μερικές φορές να βρεθούν από δευτεροταγή δομή.[21]

Έχει αποδειχθεί ότι οι α-έλικες είναι πιο σταθερές, πιο ανθεκτικές σε μεταλλάξεις και πιο σχεδιασμένες από τις β-αλυσίδες στις φυσικές πρωτεΐνες, [29] έτσι ο σχεδιασμός λειτουργικών πρωτεϊνών α είναι πιθανό να είναι ευκολότερος από το σχεδιασμό πρωτεϊνών και με έλικες και με αλυσίδες. Αυτό επιβεβαιώθηκε πρόσφατα πειραματικά.[30]

Παραπομπές

Παραπέρα μελέτη

Πρότυπο:Refbegin

Πρότυπο:Refend

Εξωτερικοί σύνδεσμοι