Гелитрон (биология) - Helitron (biology)

Гелитроны являются одной из трех групп эукариотических мобильных элементов (TE) класса 2, описанных до сих пор. Они представляют собой эукариотические подвижные элементы по типу катящегося круга, которые, как предполагается, транспонируются с помощью механизма репликации по катящемуся кругу через одноцепочечное промежуточное соединение ДНК . Впервые они были обнаружены у растений ( Arabidopsis thaliana и Oryza sativa ) и у нематоды Caenorhabditis elegans , а теперь они были идентифицированы у самых разных видов, от простейших до млекопитающих . Гелитроны составляют значительную часть многих геномов, где неавтономных элементов часто больше, чем предполагаемых автономных партнеров. Гелитроны, по-видимому, играют важную роль в эволюции геномов хозяев. Они часто захватывают различные гены-хозяева, некоторые из которых могут эволюционировать в новые гены-хозяева или стать важными для транспозиции Helitron .

История

Гелитроны были первой группой ТЕ, обнаруженной с помощью компьютерного анализа последовательностей всего генома. Первые описанные гелитроны назывались Aie, AthE1, Atrep и Basho, которые представляют собой неавтономные гелитроны, обнаруженные в геноме Arabidopsis thaliana , небольшого цветущего растения. Несмотря на эти открытия, классификация гелитронов была неизвестна до 2001 года, когда были открыты кодирующие белковые элементы, которые, как предполагалось, были автономными партнерами. Капитонов и Юрка исследовали кодирующую способность гелитронов у A. thaliana , Oryza sativa и Caenorhabditis elegan, используя in silico исследования повторяющейся ДНК этих организмов, компьютерный анализ и моделирование методом Монте-Карло . Они описали структуру и кодирующий потенциал канонических гелитронов и предложили механизм перемещения по кругу, а также возможность того, что некоторые из кодируемых генов, захваченных от хозяина, теперь используются для репликации. Их исследование генома этих организмов показало, что активность Helitron может вносить вклад в значительную часть (~ 2%) геномов растений и беспозвоночных, в которых они были обнаружены, но степень их распространения в других местах не была ясна.

В 2003 году группа исследователей изучала структуру белков, связанных с гелитронами, и различными кодирующими доменами внутри них, ища элементы, подобные гелитрону, у позвоночных, в частности у рыб-зебр, Danio rerio и рыбы- фугу , Sphoeroides nephelus . Было предсказано, что белки Rep / Helicase будут на 500-700 аминокислот длиннее из-за C-концевого слияния домена, гомологичного апуриново-апиримидиновой (AP) эндонуклеазе. Предыдущие филогенетические исследования показали, что AP-эндонуклеаза вложена в кладу Chicken Repeat 1 (CR1) ретротранспозонов с недлинными концевыми повторами (non-LTR). Эта взаимосвязь предполагает, что эндонуклеаза AP происходит из вставки ретротранспозона либо поблизости, либо внутри Helitron. Эти исследователи не смогли идентифицировать концы единицы Rep / Helicase / Endonuclease Helitron.

В последние годы гелитроны были идентифицированы во всех царствах эукариот, но число их геномных копий сильно варьируется, даже среди близкородственных видов. Они составляют 1–5% геномной ДНК у различных плодовых мушек, 0–3% у млекопитающих,> 0,5% у лягушки. У большинства млекопитающих присутствие Helitron незначительно и ограничивается остатками старых транспозонов, за исключением геномов летучих мышей, которые населены многочисленными молодыми элементами. Однако спустя много лет после описания автономных гелитронов не было опубликовано никаких механистических исследований, и поэтому механизм перемещения по кругу остается хорошо подтвержденной, но еще не проверенной гипотезой.

Состав

Структура и возможности кодирования канонических животных и растений Helitron

Гелитроны структурно асимметричны и являются единственным классом транспозонов эукариотической ДНК, которые не генерируют дупликации сайтов-мишеней во время транспозиции. Канонические гелитроны обычно начинаются с 5'T (C / T) и заканчиваются нуклеотидами CTRR (чаще всего CTAG, но иногда отмечаются вариации), но не содержат концевых инвертированных повторов. Кроме того, они часто имеют короткую палиндромную последовательность (от 16 до 20 нуклеотидов) в виде шпильки примерно на 11 п.н. от 3'-конца. Они интегрируются между динуклеотидом хозяина AT. Некоторые семейства Helitron также несут тандемные повторы, такие как микросателлиты и минисателлиты, которые, как правило, являются сильно мутабельными последовательностями.

Большинство гелитронов являются неавтономными элементами и имеют общие концы и другие структурные признаки с автономными гелитронами, но они не кодируют какой-либо полный набор белков, кодируемых автономными элементами. Основными ферментативными признаками Helitrons являются домены инициатора репликации (Rep) и ДНК-геликазы (Hel), которые присутствуют в белке, состоящем из 1000–3000 аминокислот (аа) (Rep / Hel), кодируемых всеми автономные элементы Helitron. Белок Rep / Helicase включает мотивы «цинковые пальцы», домен Rep (который составляет ~ 100 аминокислотных остатков и обладает эндонуклеазной активностью HUH) и геликазу семейства PiF1 с восемью доменами (SuperFamily1), которые универсально консервативны в Helitron. Мотивы, похожие на цинковые пальцы, связаны со связыванием ДНК. Домен Hel с длиной ~ 400 аминокислотных остатков классифицируется как ДНК Hel от 5 'до 3', который участвует в разрыве и присоединении одноцепочечной ДНК и характеризуется как наличием мотива HUH (два остатка гистидина, разделенных гидрофобной остаток) и мотив Y (один или два остатка тирозина , разделенных несколькими аминокислотами). Семейство геликаз PiF1 (Hel) обладает 5'-3'-раскручивающей активностью, которая для многих сущностей катящегося круга эта активность кодируется хозяином. Plant Helitrons также кодируют открытую рамку считывания, гомологичную одноцепочечным ДНК-связывающим белкам (RPA). Обычно белки RPA в гелитронах имеют длину 150-500 аминокислот и кодируются несколькими экзонами. Во всех гелитронах домен Rep предшествует домену Hel.

Трехмерная структура транспозазы Helitron, ковалентно связанная с левым концом транспозона, была недавно определена с помощью криоЭМ.

Механизмы перестановки катящегося круга

Предполагается, что гелитроны могут транспонироваться по механизму, подобному репликации по катящемуся кругу через одноцепочечное промежуточное соединение ДНК. Предлагаются две модели механизма транспозиции: согласованная и последовательная. В согласованной модели расщепление и лигирование донорной цепи происходит одновременно, в то время как в последовательной модели они происходят поэтапно. Согласованная модель не требует круговых промежуточных звеньев, хотя они могут возникать, если шаг не работает или пропускается во время транспонирования. Последовательная модель отличается тем, что кольцевой промежуточный продукт является необходимым этапом транспозиции, и поскольку до недавнего времени кольцевые промежуточные продукты не были известны для гелитронов, согласованная модель была адаптирована для объяснения транспозиции.

В любом случае, используя реконструированные транспозоны Helraiser для изучения транспозиции Helitron, было показано, что донорский сайт должен быть двухцепочечным и что одноцепочечных доноров будет недостаточно.

Согласованная модель

Механизм катящегося круга для транспозиции Helitron и приобретения генов в согласованной модели

Helitron мог быть как автономным, так и неавтономным. Одна молекула транспозазы расщепляется у донора (первым остатком тирозина (Y1) белка Rep) и сайтов-мишеней (вторым остатком тирозина (Y2)) и связывается с полученными 5'-концами. Свободный 3 'OH в целевой ДНК атакует связь ДНК-Y1 и образует связь с донорной цепью, что приводит к переносу цепи. Репликация на отщепленном донорском сайте начинается на свободном 3'-ОН, где донорная цепь служит праймером для синтеза ДНК с помощью ДНК-полимеразы хозяина, и репликация продолжается, чтобы заместить одну цепь гелитрона. Если палиндром и 3'-конец элемента распознаются правильно, расщепление происходит после последовательности CTRR, и одна цепь Helitron переносится на донорский сайт, где репликация ДНК разрешает гетеродуплекс.

Последовательная модель

а) Плазмида, содержащая гелитрон: ген устойчивости к антибиотику (канамицин) вставлен между левой и правой концевыми последовательностями (LTS и RTS соответственно); б) Кольцевой промежуточный продукт транспозиции: концевые последовательности соединены вместе (серая стрелка указывает на промотор гена)

В 2016 году было опубликовано одно из первых механистических исследований транспозиции гелитронов, чтобы пролить свет на различные этапы транспозиции. Основываясь на согласованной последовательности, он реконструировал вероятного предка семейства гелитронов Helibat, присутствующего в геноме маленькой коричневой летучей мыши ( Myotis Lucifugus ), единственной группы млекопитающих, обладающей значительным количеством гелитронов в своем геноме . Этот активный транспозон был вставлен в плазмиду, действующую как донор гелитрона. Ген устойчивости к антибиотикам был включен между двумя концевыми последовательностями гелитрона, чтобы обеспечить изоляцию клеток, в которых произошла транспозиция.

Во время транспозиции гелитрона образуется кольцевой интермедиат, который выделяется в клетках, трансфицированных плазмидой. Он образован соединением концевых концов и предлагает модель транспозиции по типу катящегося круга, во время которой расщепление донорной и целевой цепей не происходит одновременно, поскольку однониточная кольцевая ДНК сначала формируется с одной цепью. нитей гелитрона.

Эта модель подтверждается тем фактом, что делеция одного из двух тирозинов (Y727) домена Rep, который, как считается, участвует в расщеплении цепей, на самом деле не влияет на эффективность транспозиции гелитрона. Потребуется только один из тирозинов, чтобы обеспечить двухэтапный процесс: 1) расщепление донорской ДНК и 2) интеграция в целевой сайт.

Донорская последовательность (черная) и целевая последовательность (синяя); helitron разделен на три части (LTS - синий, кодирующая последовательность - серый, RTS - фиолетовый). а) тирозин белка Rep-Hel расщепляет 5'-конец LTS в донорной последовательности; б) используя активность геликазы от 5 'до 3', Rep-Hel перекатывается до 3 'конца RTS; в) отщепление 3'-конца после обнаружения RTS; г) соединение конечных последовательностей и образование промежуточного круга; д) расщепление целевой цепи и интеграция гелитрона после пассивного разрешения


Механизмы захвата гена

Присутствие смежных экзонов и интронов в ДНК хозяина, переносимых Helitrons, предполагает механизм приобретения, основанный на ДНК. Было предложено, чтобы захват гена Helitron происходил поэтапно или последовательно, т.е. захват гена происходит во время одной транспозиции, а захват второго гена происходит во время последующего события транспозиции. Пошаговый захват приведет к появлению гелитронов, содержащих фрагменты генов из разных мест. Модель последовательного захвата может объяснить гелитроны, несущие множественные фрагменты генов, наблюдаемые у других организмов. Предлагаются три основные модели для объяснения механизма захвата генов на уровне ДНК в гелитронах.

Модель конечного байпаса

Также известна как «трансдукционная» или «сквозная» модель 1 (RTM1). Транспозиция инициируется на 5'-конце, и захват гена происходит, если пропущен 3'-сигнал терминации. Загадочный нисходящий палиндром мог бы предоставить новый терминатор, если бы нормальный терминатор был пропущен и вся промежуточная последовательность была бы захвачена. В этом отношении гелитроны можно рассматривать как машины для перетасовки экзонов. Поскольку случайная последовательность обеспечивает новый сигнал терминации, эта модель не требует высокой плотности гелитронов в геноме.

Действительно, в слияниях одностороннего типа вставленный фрагмент донорской ДНК фланкирован на одном конце (константный конец) IRR, а на другом конце - последовательностью CTTG или GTTC, присутствующей в доноре (вариабельный конец) в некотором смысле. что обычно приводит к множественным тандемным вставкам донорской плазмиды или захвату фланкирующей последовательности в целевом сайте. Эта неспособность распознать сигнал терминации для транспозиции Helitron может привести к тому, что ДНК, фланкирующая 3'-конец Helitron, также будет перенесена вместе с Helitron на донорский сайт (захват гена). Возможно, именно так Helitrons приобрели дополнительные кодирующие последовательности. Несмотря на эту гипотезу, необходимы дальнейшие эксперименты, чтобы проверить механизм транспозиции.

Химерная модель транспозиции

Также известна как "сквозная" модель 2 (RTM2). В этой модели транспозиция инициируется на 5'-конце Helitron, и если 3'-конец этого Helitron отсутствует, поэтому транспозиция завершается на следующем 3'-конце Helitron в правильной ориентации, происходит захват гена. В результате фиксируется вся промежуточная последовательность.

Модель наполнителя ДНК (FDNA)

В этой модели части генов или некодирующие области могут случайно служить в качестве матриц во время репарации двухцепочечных разрывов (DSB), возникающих в гелитронах во время их транспозиции. Восстановление DSB с помощью негомологичных концевых соединений происходит чаще у растений и млекопитающих, чем восстановление путем гомологичной рекомбинации, и часто сопровождается вставками «ДНК-наполнителя» длиной 100–4000 п.н., скопированных с разнородной геномной или внехромосомной ДНК. регионов в DSB. Эта модель предсказывает, что области микрогомологии от 2 до 8 пар оснований существуют между областями, которые фланкируют DSB в Helitron и которые фланкируют исходную последовательность хозяина, захваченную Helitron.

Другие

Существуют также другие модели механизма захвата генов, предложенные для гелитронов: модель сайт-специфической рекомбинации, которая основана на общих чертах между гелитронами и интегронами ; Захват переносных элементов, основанный на интеграции TE посредством транспозиции в другие TE, также называемый вложением TE. Несмотря на все эти предложенные модели, не хватает примеров, чтобы ограничить механизм захвата гена одной моделью. Необходимы дальнейшие исследования, чтобы понять молекулярный механизм захвата генов и то, как он способствует выживанию гелитронов.

Доказательства, подтверждающие модели «сквозного чтения», по-видимому, заключаются в относительной недостаточной важности 3 'RTS по сравнению с 5' LTS: удаление LTS приводит к серьезному снижению эффективности транспозиции гелитронов, в то время как полная Удаление RTS по-прежнему приводит к значительному перемещению, несмотря на уменьшение количества копий. RTS указывает белку Rep-Hel конец гелитрона и, следовательно, конец транспозиции. Вся эта информация заключается в структуре шпильки, образованной палиндромной последовательностью ДНК на 3'-конце. Такая небольшая структура, вероятно, со временем изменится, что позволит обойти конец гелитрона во время его транспозиции и захватить последовательность соседнего гена.

Влияние на экспрессию генов

Гелитроны, как и все другие ТЕ, являются потенциальными инсерционными мутагенами . Они могут быть вставлены в промоторную область гена, что приводит к отмене измеримых транскриптов и наблюдаемых фенотипов . В некоторых случаях было замечено, что вставка Helitron обеспечивает регуляторные мотивы, необходимые для инициации транскрипции. Исследователи представили доказательства того, что Helitrons внесли предполагаемые промоторы, экзоны, сайты сплайсинга, сайты полиаденилирования и сайты связывания микроРНК в транскрипты, которые в остальном сохраняются у млекопитающих. Гелитроны управляют экспрессией и обеспечивают de novo регуляторные элементы, такие как CAAT-бокс, GCbox, мотив октамера и сайты TATA-бокса . Гелитроны также могут изменять длину и последовательность как 5'-UTR, так и 3'-UTR кодирующих транскриптов. Еще один способ, которым Helitrons могут контролировать экспрессию генов, - это участие в новых вариантах сплайсинга, продвижение альтернативного сплайсинга и обеспечение скрытых сайтов сплайсинга. Сообщалось о ряде спонтанных мутаций в растениях, которые вызваны интронными вставками Helitron, которые приводят к образованию химерных видов транскриптов.

Полногеномная идентификация

Конвейер для полногеномной идентификации кандидатов в гелитроны и их проверки

Атипичная структура, отсутствие модификации сайта-мишени и неоднородность последовательностей гелитронов затрудняют автоматическую идентификацию гелитронов. Для полногеномного анализа были применены два подхода для поиска канонических гелитронов: подходы идентификации повторений De novo, которые можно использовать для построения консенсусных библиотек всех повторяющихся последовательностей, но подходы поиска повторений De novo будут идентифицировать только гелитроны, которые присутствуют в множественные относительно однородные копии в геноме. Следовательно, младшие копии и старые гелитроны будут иметь тенденцию быть фрагментированными и иметь плохо определенные концы. Эти подходы ограничены качеством сборки генома и однородностью повторов. Другой подход основан на структуре, которая опирается на структурные особенности канонических Helitron и использует такие программы, как Helitronfinder, HelSearch, Helraizer и HelitronScanner. Поскольку эти программы обучены на известных элементах Helitron, они могут быть неэффективными при идентификации расходящихся семейств и генерируют много ложных срабатываний. Этот подход не создает согласованных последовательностей кандидатов в Helitron, что приводит к большим наборам данных.

Чувствительность подхода, основанного на структуре (правильно идентифицировано / (правильно идентифицировано + ложноотрицательные результаты)) составляет 93%, а специфичность (правильно идентифицировано / (правильно идентифицировано + ложноположительные результаты)) составляет 99%. Есть несколько причин, по которым все другие методы открытия Helitron были менее чувствительными и / или более подверженными ошибкам: поиск на основе Rep / геликазы дает большое количество ложноотрицательных результатов, потому что большинство Helitron являются неавтономными элементами. Поиск на основе сходства не выявит новых семейств и, следовательно, будет плохо работать в недавно изученных геномах. Поиск на основе повторов требует обширного ручного курирования для определения семейств Helitron, что является непосильной задачей для больших геномов со значительным повторением ДНК. На основе общей чувствительности и специфичности структурный подход к идентификации элементов Helitron является весьма успешным и особенно полезным для идентификации элементов Helitron в недавно охарактеризованном геноме. Однако, поскольку для совмещения необходимы как минимум 2 копии, единичные копии Helitron будут пропущены.

Вертикальное наследование и горизонтальный перенос

Наследование: полногеномный анализ показал, что большая часть гелитронов, как правило, возникла совсем недавно. На молодой возраст семей Helitron, конечно же, влияют тщательно изученные геномы, в основном растения и насекомые, у которых неограниченный период полураспада ДНК (среднее время, в течение которого теряется половина ДНК, не законсервированной для функционирования). довольно быстро. В отличие от других транспозонов ДНК, гелитроны некоторых видов, как сообщается, проявляют долгосрочную активность, вероятно, из-за механизма транспозиции или неспособности хозяина распознавать гелитроны из-за гетерогенности последовательности или захвата гена хозяина. В отличие от относительно более быстрого неограниченного периода полужизни ДНК (2,5–14 млн лет) геномов растений и насекомых, период полураспада ДНК млекопитающих оценивается намного медленнее (884 млн лет), что наряду с минимальными требованиями транспозиции Helitron и медленная скорость распада у млекопитающих вызвала этот образец вертикальной стойкости.

Горизонтальный перенос: влияние горизонтального переноса (ГТ) мобильных элементов может быть значительным из-за их мутагенного потенциала, присущей им подвижности и изобилия. Исследователи нашли доказательства повторяющейся HT четырех различных семейств Helitron у беспрецедентного множества организмов, включая млекопитающих, рептилий, рыб, беспозвоночных и вирусы насекомых. Гелитроны, присутствующие у этих видов, имеют неоднородное распределение и тесно связаны (80–98% идентичности последовательностей), несмотря на большое время расхождения между хозяевами. В отличие от генов, гелитроны, которые горизонтально переместились в новые геномы хозяина, могут амплифицироваться, в некоторых случаях достигая нескольких сотен копий и представляющих значительную часть генома. Поскольку известно, что гелитроны часто захватывают и амплифицируют фрагменты генов, HT этой уникальной группы транспозонов ДНК может привести к горизонтальному переносу генов и вызвать резкие сдвиги в траектории эволюции генома.

Эволюционное значение

Два разных сценария описывают наиболее вероятную судьбу гена-хозяина, захваченного Helitron'ами: 1. Захваченный ген был бы разрушен множественными мутациями, если бы он не обеспечивал какого-либо избирательного преимущества транспозонам. 2. Он будет сохранен как ген, связанный с исходным геном хозяина, если его захват благоприятен для транспозона, который переносится хозяином. Гелитроны, как и большинство других мобильных элементов в геномах A. thaliana и C. elegans , присутствуют в геномах во множестве сильно различающихся семейств. Учитывая молодой возраст этих семей и степень консервативности белка, маловероятно, что наблюдаемая дивергенция является результатом мутаций, накопленных транспозонами, интегрированными в геном хозяина, что доказывает, что гелитроны работают как мощный инструмент эволюции. Они набрали гены хозяина, модифицировали их до такой степени, которая недостижима для менделевского процесса, и приумножили их в геномах хозяина.

Будущее

Хотя общепринято, что гелитроны являются транспозонами RC, и благодаря многочисленным исследованиям роль транспозиции гелитронов в дупликации генов и формировании генетической архитектуры была доказана, но ни различные механизмы, с помощью которых это происходит, ни частота, хорошо изучены. На данный момент даже неясно, инициирует или завершает 3'-конец транспозона Helitron репликативную транспозицию Helitron. Важным шагом к исследованию этого механизма могло бы стать выделение автономных гелитронов, активных in vitro и in vivo . Это может быть сделано путем компьютерной идентификации полных молодых гелитронов. В ближайшем будущем подробные компьютерные исследования последовательностей позволят исследователям понять эволюционную историю гелитронов вместе с их механизмом захвата генов и их общим значением для эволюции генов.

использованная литература