Дублирование гена - Gene duplication

Дупликация генов (или хромосомная дупликация, или амплификация гена ) является основным механизмом, посредством которого в ходе молекулярной эволюции генерируется новый генетический материал . Его можно определить как любую дупликацию участка ДНК , содержащего ген . Дупликации генов могут возникать в результате нескольких типов ошибок в механизмах репликации и восстановления ДНК, а также в результате случайного захвата эгоистичными генетическими элементами. Общие источники дупликации генов включают эктопическую рекомбинацию , событие ретротранспозиции , анеуплоидию , полиплоидию и проскальзывание репликации .

Механизмы дублирования

Внематочная рекомбинация

Дупликации возникают в результате события, называемого неравным кроссинговером, которое происходит во время мейоза между смещенными гомологичными хромосомами. Вероятность того, что это произойдет, зависит от степени распределения повторяющихся элементов между двумя хромосомами. Продуктами этой рекомбинации являются дупликация в месте обмена и реципрокная делеция. Эктопическая рекомбинация обычно опосредуется сходством последовательностей в точках дублирования, которые образуют прямые повторы. Повторяющиеся генетические элементы, такие как мобильные элементы, предлагают один источник повторяющейся ДНК, которая может облегчить рекомбинацию, и они часто обнаруживаются в точках разрыва дупликации у растений и млекопитающих.

Схема участка хромосомы до и после события дупликации

Проскальзывание репликации

Проскальзывание репликации - это ошибка репликации ДНК, которая может приводить к дублированию коротких генетических последовательностей. Во время репликации ДНК-полимераза начинает копировать ДНК. В какой-то момент в процессе репликации полимераза отделяется от ДНК, и репликация останавливается. Когда полимераза повторно присоединяется к цепи ДНК, она выравнивает реплицирующую цепь в неправильном положении и случайно копирует один и тот же участок более одного раза. Проскальзыванию репликации также часто способствуют повторяющиеся последовательности, но для этого требуется лишь несколько оснований сходства.

Ретротранспозиция

Ретротранспозоны , в основном L1 , иногда могут действовать на клеточную мРНК. Транскрипты обратно транскрибируются в ДНК и вставляются в случайное место в геноме, создавая ретрогены. Результирующая последовательность обычно не имеет интронов и часто содержит поли-последовательности, которые также интегрированы в геном. Многие ретрогены обнаруживают изменения в регуляции генов по сравнению с последовательностями их родительских генов, что иногда приводит к новым функциям.

Анеуплоидия

Анеуплоидия возникает, когда нерасхождение одной хромосомы приводит к аномальному количеству хромосом. Анеуплоидия часто опасна и у млекопитающих регулярно приводит к самопроизвольным абортам (выкидышам). Некоторые анеуплоидные особи жизнеспособны, например трисомия 21 у человека, которая приводит к синдрому Дауна . Анеуплоидия часто изменяет дозировку генов вредным для организма образом; поэтому маловероятно, что он будет распространяться среди населения.

Полиплоидия

Полиплоидия или дупликация всего генома - это продукт нерасхождения во время мейоза, что приводит к появлению дополнительных копий всего генома. Полиплоидия является обычным явлением у растений, но также встречается и у животных, с двумя раундами дупликации всего генома ( событие 2R ) в линии позвоночных, ведущих к человеку. Это также произошло в дрожжах гемиаскомицетов ~ 100 млн лет назад.

После дупликации всего генома наступает относительно короткий период нестабильности генома, обширная потеря генов, повышенные уровни нуклеотидных замен и перестройка регуляторной сети. Кроме того, важную роль играют эффекты дозировки генов. Таким образом, большинство дубликатов теряется в течение короткого периода времени, однако значительная часть дубликатов выживает. Интересно, что гены, участвующие в регуляции, преимущественно сохраняются. Более того, сохранение регуляторных генов, в первую очередь Hox-генов , привело к адаптивным инновациям.

Быстрая эволюция и функциональная дивергенция наблюдаются на уровне транскрипции дублированных генов, обычно за счет точечных мутаций в коротких мотивах связывания факторов транскрипции. Более того, быстрая эволюция мотивов фосфорилирования белков, обычно встроенных в быстро эволюционирующие внутренне неупорядоченные области, является еще одним фактором, способствующим выживанию и быстрой адаптации / неофункционализации повторяющихся генов. Таким образом, кажется, существует связь между регуляцией генов (по крайней мере, на посттрансляционном уровне) и эволюцией генома.

Полиплоидия также является хорошо известным источником видообразования, поскольку потомство, которое имеет другое количество хромосом по сравнению с родительскими видами, часто неспособно скрещиваться с неполиплоидными организмами. Считается, что дупликации всего генома менее вредны, чем анеуплоидия, поскольку относительные дозы отдельных генов должны быть одинаковыми.

Как эволюционное событие

Эволюционная судьба повторяющихся генов

Скорость дупликации гена

Сравнение геномов показывает, что дупликации генов обычны у большинства исследованных видов. На это указывает переменное количество копий (вариация количества копий) в геноме человека или плодовой мушки. Однако было трудно измерить скорость, с которой происходит такое дублирование. Недавние исследования дали первую прямую оценку скорости дупликации генов по всему геному у C. elegans , первого многоклеточного эукариота, для которого такие оценки стали доступны. Уровень дупликации генов у C. elegans составляет порядка 10-7 дупликаций на ген / поколение, то есть в популяции из 10 миллионов червей у одного будет дупликация гена на поколение. Эта скорость на два порядка больше, чем скорость спонтанной точечной мутации на нуклеотидный сайт у этого вида. В более ранних (непрямых) исследованиях сообщалось о степени локус-специфической дупликации у бактерий, дрозофилы и людей в диапазоне от 10 -3 до 10 -7 / ген / поколение.

Неофункционализация

Дупликации генов - важный источник генетической новизны, которая может привести к эволюционным инновациям. Дупликация создает генетическую избыточность, при которой вторая копия гена часто свободна от селективного давления, то есть ее мутации не оказывают вредного воздействия на организм-хозяин. Если одна копия гена подвергается мутации, которая влияет на ее исходную функцию, вторая копия может служить «запасной частью» и продолжать правильно функционировать. Таким образом, гены-дубликаты накапливают мутации быстрее, чем функциональные гены-единственные копии, на протяжении поколений организмов, и у одной из двух копий может развиться новая и отличная функция. Некоторыми примерами такой неофункционализации являются очевидная мутация дублированного пищеварительного гена в семействе ледяной рыбы в ген антифриза и дупликация, приводящая к новому гену змеиного яда и синтезу 1-бета-гидрокситестостерона у свиней.

Считается, что дупликация генов играет важную роль в эволюции ; такую ​​позицию придерживаются представители научного сообщества более 100 лет. Сусуму Оно был одним из самых известных разработчиков этой теории в своей классической книге « Эволюция путем дупликации генов» (1970). Оно утверждал, что дупликация генов - самая важная эволюционная сила с момента появления универсального общего предка . Основные случаи дупликации генома могут быть довольно частыми. Считается, что весь геном дрожжей подвергся дупликации около 100 миллионов лет назад. Растения - самые плодовитые дупликаторы генома. Например, пшеница - гексаплоид (разновидность полиплоида ), что означает, что у нее шесть копий своего генома.

Субфункционализация

Другая возможная судьба повторяющихся генов заключается в том, что обе копии в равной степени могут накапливать дегенеративные мутации, если любые дефекты дополняются другой копией. Это приводит к нейтральной модели «субфункционализации» или модели DDC (дупликация-дегенерация-комплементация), в которой функциональность исходного гена распределяется между двумя копиями. Ни один из генов не может быть потерян, поскольку оба теперь выполняют важные неизбыточные функции, но в конечном итоге ни один из них не может достичь новых функций.

Субфункционализация может происходить через нейтральные процессы, в которых мутации накапливаются без вредных или положительных эффектов. Однако в некоторых случаях может происходить субфункционализация с явными адаптивными преимуществами. Если предковый ген является плейотропным и выполняет две функции, часто ни одна из этих двух функций не может быть изменена, не затрагивая другую функцию. Таким образом, разделение наследственных функций на два отдельных гена может позволить адаптивную специализацию подфункций, тем самым обеспечивая адаптивное преимущество.

Потеря

Часто в результате геномные вариации гена приводит к дозированному зависимым неврологическим расстройствам , таким как Ретта как синдром и болезнь Пелицеуса-Мерцбахер . Такие вредные мутации, вероятно, будут утеряны в популяции и не будут сохранены или не будут развиваться в новых функциях. Однако многие дупликации на самом деле не являются вредными или полезными, и эти нейтральные последовательности могут быть потеряны или могут распространяться по популяции посредством случайных колебаний через генетический дрейф .

Выявление дупликаций в секвенированных геномах

Критерии и сканирование одного генома

Два гена, которые существуют после события дублирования гена, называются паралогами и обычно кодируют белки со схожей функцией и / или структурой. Напротив, ортологичные гены присутствуют у разных видов, каждый из которых первоначально происходит от одной и той же предковой последовательности. (См. Гомология последовательностей в генетике ).

В биологических исследованиях важно (но часто трудно) различать паралогов и ортологов. Эксперименты по функции генов человека часто можно проводить на других видах, если гомолог человеческого гена можно найти в геноме этого вида, но только если гомолог является ортологом. Если они паралоги и возникли в результате дублирования гена, их функции, вероятно, будут слишком разными. Одна или несколько копий дублированных генов, составляющих семейство генов, могут быть затронуты вставкой мобильных элементов, которые вызывают значительные различия между ними в их последовательности и, наконец, могут стать ответственными за дивергентную эволюцию . Это также может повлиять на вероятность и скорость преобразования генов между гомологами дубликатов генов из-за меньшего или отсутствия сходства в их последовательностях.

Паралоги могут быть идентифицированы в отдельных геномах путем сравнения последовательностей всех аннотированных генных моделей друг с другом. Такое сравнение может быть выполнено с транслированными аминокислотными последовательностями (например, BLASTp, tBLASTx) для идентификации древних дупликаций или с нуклеотидными последовательностями ДНК (например, BLASTn, мегабластные) для выявления более поздних дупликаций. Большинство исследований по выявлению дупликаций генов требуют взаимного наилучшего совпадения или нечеткого взаимного наилучшего совпадения, где каждый паралог должен быть единственным лучшим совпадением другого при сравнении последовательностей.

Большинство дупликаций генов существуют в виде низкокопийных повторов (LCR), довольно часто повторяющихся последовательностей, таких как мобильные элементы. В основном они обнаруживаются в перицентрономических , субтеломерных и интерстициальных областях хромосомы. Многие LCR из-за своего размера (> 1 КБ), сходства и ориентации очень чувствительны к дупликациям и делециям.

Геномные микрочипы обнаруживают дупликации

Такие технологии, как геномные микроматрицы , также называемые сравнительной геномной гибридизацией массивов (array CGH), используются для обнаружения хромосомных аномалий, таких как микродупликации, с высокой пропускной способностью из образцов геномной ДНК. В частности, технология ДНК- микрочипов позволяет одновременно контролировать уровни экспрессии тысяч генов при различных методах лечения или экспериментальных условиях, что значительно облегчает эволюционные исследования регуляции генов после дупликации или видообразования генов .

Секвенирование нового поколения

Дупликации генов также можно идентифицировать с помощью платформ секвенирования следующего поколения. Простейший способ выявления дупликаций в данных геномного повторного секвенирования - использование считывания парных концов секвенирования. Тандемные дупликации указываются секвенированием пар чтения, которые отображаются в аномальной ориентации. Благодаря комбинации увеличенного охвата последовательностей и аномальной ориентации картирования можно идентифицировать дупликации в данных геномного секвенирования.

Как усиление

Дублирование генов не обязательно означает длительное изменение генома вида. Фактически, такие изменения часто не длятся дольше первоначального организма-хозяина. С точки зрения молекулярной генетики , генной амплификации является одним из многих способов , в которых ген может быть избыточно экспрессируется . Генетическая амплификация может происходить искусственно, например, с использованием метода полимеразной цепной реакции для амплификации коротких цепей ДНК in vitro с использованием ферментов , или может происходить естественным путем, как описано выше. Если это естественная дупликация, она все еще может иметь место в соматической клетке , а не в клетке зародышевой линии (что было бы необходимо для длительного эволюционного изменения).

Роль в раке

Дублирование онкогенов - частая причина многих видов рака . В таких случаях генетическая дупликация происходит в соматической клетке и затрагивает только геном самих раковых клеток, а не весь организм, не говоря уже о любом последующем потомстве.

Распространенные амплификации онкогенов при раке человека
Тип рака Связанные
амплификации генов
Распространенность
амплификации
при типе рака
(в процентах)
Рак молочной железы МОЙ С 20%
ERBB2 ( HER2 ) 20%
CCND1 ( Циклин D1 ) 15–20%
FGFR1 12%
FGFR2 12%
Рак шейки матки МОЙ С 25–50%
ERBB2 20%
Колоректальный рак HRAS 30%
КРАС 20%
MYB 15–20%
Рак пищевода МОЙ С 40%
CCND1 25%
MDM2 13%
Рак желудка CCNE ( Циклин E ) 15%
КРАС 10%
ВСТРЕТИЛИСЬ 10%
Глиобластома ERBB1 ( EGFR ) 33–50%
CDK4 15%
Рак головы и шеи CCND1 50%
ERBB1 10%
МОЙ С 7–10%
Гепатоцеллюлярный рак CCND1 13%
Нейробластома MYCN 20–25%
Рак яичников МОЙ С 20–30%
ERBB2 15–30%
AKT2 12%
Саркома MDM2 10–30%
CDK4 10%
Мелкоклеточный рак легкого МОЙ С 15–20%

Смотрите также

использованная литература

внешние ссылки