Белковое суперсемейство - Protein superfamily

Белок надсемейство является самой крупной группировкой ( клады ) из белков , для которых общее происхождение можно сделать вывод (см гомологии ). Обычно это общее происхождение выводится из структурного выравнивания и механистического сходства, даже если сходство последовательностей не является очевидным. Затем можно вывести гомологию последовательностей, даже если она не очевидна (из-за низкого сходства последовательностей). Суперсемейства обычно содержат несколько семейств белков, которые демонстрируют сходство последовательностей в каждом семействе. Термин клан белков обычно используется для суперсемейств протеаз и гликозилгидролаз на основе систем классификации MEROPS и CAZy .

Идентификация

Выше вторичная структурная консервация 80 членов клана протеаз PA (суперсемейство). H обозначает α-спираль , E обозначает β-лист , L обозначает петлю. Ниже показано сохранение последовательности для того же выравнивания. Стрелки указывают остатки каталитической триады . Согласовано на основе структуры DALI

Суперсемейства белков идентифицируют с помощью ряда методов. Близкородственные члены могут быть идентифицированы разными методами, нежели те, которые необходимы для группировки наиболее эволюционно расходящихся членов.

Сходство последовательностей

Выравнивание последовательности из млекопитающих гистонов белков. Сходство последовательностей подразумевает, что они возникли в результате дупликации генов . Остатки, которые сохраняются во всех последовательностях, выделены серым цветом. Ниже белковых последовательностей находится ключ, обозначающий консервативную последовательность (*), консервативные мутации (:), полуконсервативные мутации (.) И неконсервативные мутации ().

Исторически сходство различных аминокислотных последовательностей было наиболее распространенным методом определения гомологии . Сходство последовательностей считается хорошим предиктором родства, поскольку похожие последовательности более вероятно являются результатом дупликации генов и дивергентной эволюции , а не результатом конвергентной эволюции . Аминокислотная последовательность обычно более консервативна, чем последовательность ДНК (из-за вырожденного генетического кода ), поэтому это более чувствительный метод обнаружения. Поскольку некоторые аминокислоты имеют сходные свойства (например, заряд, гидрофобность, размер), консервативные мутации, которые меняют их местами, часто являются нейтральными для функции. Наиболее консервативные участки последовательности белка часто соответствуют функционально важным участкам, таким как каталитические участки и участки связывания, поскольку эти участки менее устойчивы к изменениям последовательности.

Использование сходства последовательностей для вывода гомологии имеет несколько ограничений. Не существует минимального уровня сходства последовательностей, гарантирующего создание идентичных структур. В течение длительных периодов эволюции родственные белки могут не обнаруживать сходства последовательностей друг с другом. Последовательности со множеством вставок и делеций также иногда бывает трудно выровнять и, таким образом, идентифицировать области гомологичных последовательностей. В роде ПА из протеаза , например, ни один остаток сохраняется через надсемейство, даже не те , в каталитической триаде . И наоборот, отдельные семейства, составляющие суперсемейство, определяются на основе выравнивания их последовательностей, например, семейство протеазы C04 в клане PA.

Тем не менее, сходство последовательностей является наиболее часто используемой формой доказательства родства, поскольку количество известных последовательностей значительно превышает количество известных третичных структур . В отсутствие структурной информации сходство последовательностей ограничивает пределы того, какие белки могут быть отнесены к суперсемейству.

Структурное сходство

Структурная гомология в надсемействе PA (клан PA). Двойной β-бочонок, характеризующий суперсемейство, выделен красным. Показаны репрезентативные структуры из нескольких семейств суперсемейства PA. Обратите внимание, что некоторые белки имеют частично измененную структуру. Химотрипсин (1gg6), табака вирусом травление протеазы (1lvm), calicivirin (1wqs), Западный Нильский вирус протеазы (1fp7), exfoliatin токсин (1exf), HtrA протеазы (1l1j), змеиный яд активатор плазминогена (1bqy), хлоропласт протеазы (4fln ) и протеазой вируса артериита лошадей (1 мбм).

Структура гораздо более консервативна с точки зрения эволюции, чем последовательность, так что белки с очень похожими структурами могут иметь совершенно разные последовательности. В течение очень длительного периода времени эволюции очень немногие остатки демонстрируют детектируемую консервацию аминокислотной последовательности, однако вторичные структурные элементы и третичные структурные мотивы являются высококонсервативными. Некоторая динамика белка и конформационные изменения структуры белка также могут сохраняться, как это видно в суперсемействе серпинов . Следовательно, третичную структуру белка можно использовать для обнаружения гомологии между белками, даже если в их последовательностях не осталось свидетельств родства. Программы структурного выравнивания , такие как DALI , используют трехмерную структуру интересующего белка для поиска белков с похожими складками. Однако в редких случаях родственные белки могут эволюционировать и становиться несходными по структуре, и о родстве можно судить только другими методами.

Механическое сходство

Каталитический механизм ферментов в пределах надсемейства обычно сохраняются, хотя субстрат специфичность может существенно отличаться. Каталитические остатки также имеют тенденцию располагаться в том же порядке в последовательности белка. Для семейств протеаз в клане PA, хотя произошла дивергентная эволюция остатков каталитических триад, используемых для проведения катализа, все члены используют аналогичный механизм для выполнения ковалентного нуклеофильного катализа белков, пептидов или аминокислот. Однако одного механизма недостаточно, чтобы сделать вывод о родстве. Некоторые каталитические механизмы конвергентно развивались несколько раз независимо и, таким образом, образуют отдельные суперсемейства, а в некоторых суперсемействах проявляется ряд различных (хотя часто химически схожих) механизмов.

Эволюционное значение

Белковые суперсемейства представляют собой текущие пределы нашей способности определять общее происхождение. Они представляют собой самую крупную эволюционную группировку, основанную на прямых доказательствах, которые возможны в настоящее время. Поэтому они являются одними из самых древних эволюционных явлений, изученных в настоящее время. Некоторые надсемейства имеют присутствующих членов во всех царств в жизни , что свидетельствует о том , что последний общий предок , что надсемейство был в последний универсальный общий предок всего живого (LUCA).

Члены надсемейства могут принадлежать к разным видам, причем предковый белок является формой белка, существовавшего у предковых видов ( ортология ). И наоборот, белки могут принадлежать к одному виду, но произошли от одного белка, ген которого был продублирован в геноме ( паралогия ).

Диверсификация

Большинство белков содержат несколько доменов. От 66 до 80% эукариотических белков имеют несколько доменов, в то время как около 40-60% прокариотических белков имеют несколько доменов. Со временем многие суперсемейства доменов смешались. Фактически, очень редко можно найти «последовательно изолированные суперсемейства». Когда домены объединяются, порядок доменов с N-конца на C («доменная архитектура») обычно хорошо сохраняется. Кроме того, количество комбинаций доменов, наблюдаемых в природе, невелико по сравнению с количеством возможностей, предполагая, что отбор действует на все комбинации.

Примеры

Суперсемейство α / β гидролаз - члены разделяют α / β лист, содержащий 8 цепей, соединенных спиралями , с каталитическими триадными остатками в одном и том же порядке, активности включают протеазы , липазы , пероксидазы , эстеразы , эпоксидгидролазы и дегалогеназы .

Суперсемейство щелочных фосфатаз - члены имеют сэндвич-структуру αβα, а также выполняют общие беспорядочные реакции по общему механизму.

Суперсемейство глобинов - члены разделяютглобулярную глобиновую складку с 8- альфа спиралью .

Суперсемейство иммуноглобулинов - члены имеют сэндвич-подобную структуру из двух листов антипараллельных β-цепей ( Ig-складка ) и участвуют в распознавании, связывании и адгезии .

PA clan - члены разделяют химотрипсиноподобную двойную β-бочкообразную складку и аналогичныемеханизмы протеолиза , но идентичность последовательностей <10%. Клан содержит как цистеиновые, так и сериновые протеазы (разные нуклеофилы ).

Суперсемейство Ras - члены имеют общий каталитический G-домен 6-нитевого β-листа, окруженного 5 α-спиралями.

Суперсемейство серпинов - члены разделяют высокоэнергетическую стрессовую складку, которая может претерпевать большие конформационные изменения , которые обычно используются для ингибирования сериновых и цистеиновых протеаз путем нарушения их структуры.

Суперсемейство стволов TIM - члены имеют большуюструктуру стволаα 8 β 8 . Это одна из наиболее распространенных белковых складок, и монофильность этого суперсемейства все еще оспаривается.

Ресурсы белкового суперсемейства

Несколько биологических баз данных документируют суперсемейства белков и белковые складки, например:

  • Pfam - База данных выравниваний и HMM семейств белков
  • PROSITE - База данных белковых доменов, семейств и функциональных сайтов
  • PIRSF - Система классификации суперсемейства
  • PASS2 - Выравнивание белков как структурные суперсемейства v2
  • SUPERFAMILY - Библиотека HMM, представляющая суперсемейства, и база данных аннотаций (суперсемейства и семейства) для всех полностью секвенированных организмов.
  • SCOP и CATH - Классификация белковых структур на суперсемейства, семейства и домены

Аналогичным образом существуют алгоритмы, которые ищут в PDB белки, структурно гомологичные целевой структуре, например:

  • DALI - Структурное выравнивание на основе метода матрицы выравнивания расстояний

Смотрите также

использованная литература

внешние ссылки