Генная пустыня - Gene desert

Генные пустыни - это участки генома, лишенные генов, кодирующих белок. Генные пустыни составляют примерно 25% всего генома, что привело к недавнему интересу к их истинным функциям. Первоначально считалось, что они содержат несущественную и «мусорную» ДНК из-за их неспособности создавать белки, генные пустыни с тех пор были связаны с несколькими жизненно важными регуляторными функциями, включая дистальное усиление и консервативное наследование. Таким образом, растущее число рисков, ведущих к нескольким серьезным заболеваниям, включая несколько видов рака, объясняется нарушениями, обнаруженными в генетических пустынях. Одним из наиболее ярких примеров является область гена 8q24, которая при воздействии определенных однонуклеотидных полиморфизмов приводит к множеству заболеваний. Основные идентифицирующие факторы генных пустынь заключаются в их низком содержании GpC и относительно высоком уровне повторов, которые не наблюдаются в кодирующих областях. Недавние исследования позволили разделить генные пустыни на вариабельные и стабильные формы; регионы классифицируются на основе их поведения посредством рекомбинации и их генетического содержания. Хотя текущие знания о генных пустынях довольно ограничены, продолжающиеся исследования и усовершенствованные методы начинают открывать двери для изучения различных важных эффектов этих некодирующих регионов.

История

Хотя возможность функционирования в генных пустынях была предсказана еще в 1960-х годах, инструменты генетической идентификации не смогли выявить каких-либо специфических характеристик длинных некодирующих областей, кроме того, что в этих регионах не происходило кодирования. До завершения разработки генома человека в 2001 году в рамках проекта «Геном человека» большинство ранних ассоциативных сравнений генов основывалось на убеждении, что основные гены домашнего хозяйства были сгруппированы в одних и тех же областях генома для облегчения доступа и жесткого регулирования. Это убеждение позже создало гипотезу о том, что генные пустыни, следовательно, являются предыдущими регуляторными последовательностями, которые сильно связаны (и, следовательно, не подвергаются рекомбинации), но имеют замены между ними с течением времени. Эти замены могут вызвать разделение строго консервативных генов с течением времени, таким образом формируя области бессмысленных кодов с несколькими важными генами. Однако неопределенность из-за разной степени сохранения генов в разных частях хромосом не позволяла точной идентификации. Позднее ассоциации были реконструированы, когда регуляторные последовательности были связаны с факторами транскрипции, что привело к рождению крупномасштабного картирования всего генома. Так началась охота за содержанием и функциями генных пустынь. Недавние достижения в скрининге сигнатур хроматина на хромосомах (например, захват конформации хромосом , также известный как 3C) позволили подтвердить модель активации генов дальнего действия, которая постулирует, что действительно существуют физические связи между регуляторными энхансерами и их мишенью. промоутеры. Исследования генетических пустынь, хотя и сосредоточены на генетике человека, также применялись к мышам, различным птицам и Drosophila melanogaster. Хотя сохранение в геномах отдельных видов варьирует, ортологичные генные пустыни действуют аналогичным образом. Таким образом, преобладающее утверждение среди генных пустынь состоит в том, что эти некодирующие последовательности содержат активные и важные регуляторные элементы.

Возможные функции

Одно исследование было сосредоточено на регуляторном архипелаге, регионе с «островками» кодирующих последовательностей, окруженными обширными некодирующими регионами. Исследование, которое изучало влияние регуляции на hox-гены , первоначально было сосредоточено на двух энхансерных последовательностях, GCR и Prox, которые расположены на 200 пар оснований и 50 пар оснований соответственно выше локуса Hox D. Чтобы манипулировать областью, исследование инвертировало две последовательности энхансера и не обнаружило каких-либо серьезных эффектов на транскрипцию гена Hox D, даже несмотря на то, что эти две последовательности были наиболее близкими к гену последовательностями. Таким образом, они обратились в генную пустыню, которая фланкировала последовательность GCR выше по течению, и обнаружили в ней 5 регуляторных островков, которые могли регулировать ген. Чтобы выбрать наиболее вероятного кандидата, исследование затем применило несколько отдельных и множественных удалений к пяти островам, чтобы наблюдать эффекты. Эти разнообразные делеции приводили только к незначительным эффектам, включая физические отклонения или несколько пропущенных цифр.

Когда эксперимент был сделан еще дальше и применил делецию всего 830-килобазного гена пустыни, функциональность всего локуса Hox D стала неактивной. Это указывает на то, что соседняя генная пустыня, как целая единица из 830 килобаз (включая пять островных последовательностей в ней), служит важным регулятором одного гена, охватывающего всего 50 килобаз. Таким образом, эти результаты намекают на регуляторные эффекты фланкирующих генных пустынь. Это исследование было подтверждено более поздним наблюдением путем сравнения между флуоресцентной гибридизацией in situ и захватом конформации хромосомы, которое обнаружило, что локус Hox D был наиболее деконденсированной частью в регионе. Это означало, что он имел относительно более высокую активность по сравнению с фланкирующими генными пустынями. Следовательно, Hox D может регулироваться с помощью специфических соседних энхансерных последовательностей, которые не экспрессируются согласованно. Однако это предупреждает, что близость является неточной при использовании любого из аналитических методов. Т.о., ассоциации между пустынями регуляторных генов и их промоторами-мишенями, по-видимому, имеют переменные расстояния и не обязаны действовать как границы.

Образование петли приближает комплексы энхансеров к их промоторам-мишеням. Это указывает на то, что генные «острова», скрытые генными пустынями, выполняют важные регуляторные функции.

Различия в расстоянии демонстрируют, что расстояние может быть еще одним важным фактором, который определяется генетическими пустынями. Например, дистальные энхансеры могут взаимодействовать со своими целевыми промоторами посредством петлевых взаимодействий, которые должны действовать на определенном расстоянии. Таким образом, близость не является точным предиктором энхансеров: энхансерам не нужно граничить со своей целевой последовательностью, чтобы регулировать их. Хотя это приводит к изменению расстояний, среднее расстояние между стартовыми сайтами транскрипции и комплексом взаимодействия, опосредованным их энхансерными элементами, составляет 120 килобаз перед стартовым сайтом. Генные пустыни могут играть роль в построении этого расстояния, чтобы обеспечить максимальное образование петель. Учитывая, что механизм образования энхансерного комплекса является довольно просто регулируемым механизмом (структуры, которые рекрутируются в усиливающий комплекс, имеют различные регуляторные регуляторы, которые контролируют конструкцию), более 50% промоторов имеют несколько дальнодействующих взаимодействий. У некоторых основных генов даже есть до 20 возможных усиливающих взаимодействий. Существует любопытная предвзятость к формированию комплексов только перед промоторами. Таким образом, учитывая корреляцию, что многие регуляторные генные пустыни появляются выше своих целевых промоторов, возможно, что более непосредственная роль, которую играют генные пустыни, заключается в регуляции ключевых последовательностей на больших расстояниях. Поскольку для идеального формирования энхансерных взаимодействий требуются определенные конструкции, возможным побочным продуктом регуляторных ролей генных пустынь может быть консервация генов: для сохранения определенной длины петель и порядка регулирования генов, скрытых в генных пустынях, определенные части генные пустыни более консервативны, чем другие, при прохождении событий наследования. Эти консервативные некодирующие последовательности (ЦНС) напрямую связаны с синтеническим наследованием у всех позвоночных. Таким образом, наличие этих ЦНС может служить для сохранения больших участков генов. Хотя расстояние может варьироваться в пустынях регуляторных генов, оно, по-видимому, имеет верхний предел в пустынях консервативных генов. Первоначально считалось, что ЦНС расположены рядом с их консервативными генами: более ранние оценки помещали большинство ЦНС в непосредственной близости от последовательностей генов. Однако расширение генетических данных показало, что некоторые ЦНС располагаются на расстоянии до 2,5 мегабаз от своих генов-мишеней, при этом большая часть ЦНС находится между 1 и 2 мегабазами. Этот диапазон, который был измерен для генома человека, варьируется у разных видов. Например, по сравнению с людьми, рыба фугу имеет меньший диапазон с расчетным максимальным расстоянием в несколько сотен килобаз. Независимо от разницы в длине, ЦНС у обоих видов работают одинаково. Таким образом, как функции различаются между генными пустынями, так и их содержание.

Стабильные и изменчивые генные пустыни

Стабильные генные пустыни, в которых находятся более важные гены, легче сохраняются с течением времени, передавая эту консервацию соседним генам. Пустыни вариабельных генов с меньшим количеством основных генов, таким образом, подвергаются частым SNP, большинство из которых являются нейтральными.

Некоторые генные пустыни являются тяжелыми регуляторами, в то время как другие могут быть удалены без какого-либо эффекта. В качестве возможной классификации генные пустыни можно разбить на два подтипа: стабильные и изменчивые. Стабильные пустыни генов имеют меньшее количество повторов и имеют относительно более высокое содержание гуанина к цитозину (GpC), чем наблюдается в пустынях с вариабельными генами.

Содержание гуанина и цитозина указывает на функциональность кодирования белка. Например, в исследовании хромосом 2 и 4, которые были связаны с несколькими генетическими заболеваниями, в определенных регионах было повышенное содержание GpC. Мутации в этих областях, богатых GC, вызывают множество заболеваний, обнаруживая необходимую целостность этих генов. Области CpG высокой плотности служат регуляторными участками метилирования ДНК. Следовательно, основные кодирующие гены должны быть представлены регионами с высоким содержанием CpG. В частности, регионы с высоким содержанием GC должны иметь тенденцию иметь высокую плотность генов, которые посвящены главным образом основным домашним и тканеспецифическим процессам. Эти процессы потребуют максимальной продукции белка для выражения функциональности. Следовательно, стабильные генные пустыни, которые имеют более высокие уровни содержания GC, должны содержать основные энхансерные последовательности. Это могло определять консервативные функции стабильных генных пустынь.

С другой стороны, примерно 80% генных пустынь имеют низкое содержание GpC, что указывает на то, что у них очень мало важных генов. Таким образом, большинство генных пустынь представляют собой изменчивые генные пустыни, которые могут иметь альтернативные функции. Одна из распространенных теорий о происхождении генных пустынь постулирует, что генные пустыни - это скопления основных генов, действующих как расстояние. Это может быть правдой, поскольку, учитывая небольшое количество важных генов в них, эти области были бы менее консервативными. В результате, из-за преобладания превращений цитозина в тимин, наиболее распространенный SNP будет вызывать постепенное разделение между несколькими важными генами в пределах вариабельных генных пустынь. Эти важные последовательности могли бы сохраняться и консервироваться, что приводило бы к небольшим областям высокой плотности, которые регулируются на расстоянии. Таким образом, содержание GC является показателем наличия кодирующих или регуляторных процессов в ДНК.

Сравнение содержания GC и скорости рекомбинации между пустынями стабильных и вариабельных генов, разделенных кодирующим геном. Отображаемые общие соотношения не зависят друг от друга; точные значения не отражают масштабы.

В то время как стабильные генные пустыни имеют более высокое содержание GC, это относительное значение является лишь средним. В стабильных генных пустынях, хотя концы содержат очень высокие уровни содержания GC, основная масса ДНК содержит даже меньшее содержание GC, чем наблюдается в вариабельных генных пустынях. Это указывает на то, что очень мало высококонсервативных областей в стабильных генных пустынях, которые не рекомбинируют или делают это с очень низкой скоростью. Учитывая, что концы стабильных генных пустынь имеют особенно высокие уровни содержания GC, эти последовательности должны быть чрезвычайно консервативными. Эта консервация, в свою очередь, может привести к тому, что фланкирующие гены также будут иметь более высокие показатели консервации. Таким образом, стабильные гены должны быть напрямую связаны по крайней мере с одним из своих фланкирующих генов и не могут быть отделены от кодирующих последовательностей посредством событий рекомбинации. Большинство генных пустынь, по-видимому, группируются парами вокруг небольшого числа генов. Эта кластеризация создает длинные локусы с очень низкой плотностью генов; небольшие регионы с большим количеством генов окружены длинными участками генных пустынь, что создает низкий средний уровень генов. Следовательно, минимальная вероятность событий рекомбинации в этих длинных локусах создает синтенические блоки, которые наследуются вместе с течением времени. Эти синтенические блоки могут сохраняться в течение очень длительных периодов времени, предотвращая потерю основного материала, даже если расстояние между важными генами может со временем увеличиваться.

Хотя этот эффект теоретически должен быть усилен за счет еще более низкого содержания GC в вариабельных генных пустынях (тем самым действительно сводя к минимуму плотность генов), темпы сохранения генов в изменчивых генных пустынях даже ниже, чем наблюдаемые в стабильных генных пустынях - на самом деле, этот показатель составляет намного ниже, чем остальной геном. Возможное объяснение этого явления состоит в том, что вариабельные генные пустыни могут быть недавно развившимися регионами, которые еще не закреплены в стабильных генных пустынях. Следовательно, перетасовка все еще может происходить до того, как стабилизирующие области в вариабельных генных пустынях начнут группироваться в целые единицы. Есть несколько исключений из этой минимальной скорости сохранения, так как несколько пустынь генов GC подвергаются гиперметилированию, что значительно снижает доступность ДНК, таким образом эффективно защищая область от рекомбинации. Однако при наблюдении это случается редко.

Хотя стабильные и изменчивые генные пустыни различаются по содержанию и функциям, оба обладают консервативными способностями. Возможно, что, поскольку большинство вариабельных генных пустынь имеют регуляторные элементы, которые могут действовать на расстоянии, сохранение всей генной пустыни в ситенический локус не было бы необходимым, если бы сами эти регуляторные элементы сохранялись как единицы. Учитывая особенно низкие уровни содержания GC, регуляторные элементы, следовательно, будут находиться в ситуации с минимальной плотностью генов, как это наблюдается аналогично при фланкировании стабильных генных пустынь, с тем же эффектом. Таким образом, оба типа генных пустынь служат для сохранения основных генов в геноме.

Генетические заболевания

Консервативный характер генных пустынь подтверждает, что эти участки некодирующих оснований необходимы для правильного функционирования. Действительно, широкий спектр исследований нарушений в некодирующих генах обнаружил несколько ассоциаций с генетическими заболеваниями. Одной из наиболее изученных генных пустынь является область 8q24. Ранние полногеномные исследования ассоциации были сосредоточены на области 8q24 (находящейся на хромосоме 8 ) из-за аномально высокой частоты SNP, которые, по-видимому, встречаются в этом регионе. Эти исследования показали, что этот регион связан с повышенным риском развития различных видов рака, особенно простаты, груди, яичников, толстой кишки и поджелудочной железы. Используя вставки генной пустыни в бактериальные искусственные хромосомы, в одном исследовании удалось выявить активность энхансера в определенных областях, которые были выделены с помощью систем клонирования. Это исследование успешно идентифицировало энхансерную последовательность, скрытую в этом регионе. В этой энхансерной последовательности у больных мышей был обнаружен SNP, который представлял риск рака простаты, помеченный как SNP s6983267. Однако область 8q24 не ограничивается только предполагаемым риском рака простаты. Исследование, проведенное в 2008 году, проверило людей (и контрольную группу) с вариациями в регионе генной пустыни, обнаружив пять различных регионов, которые создают разные риски при воздействии разных SNP. В этом исследовании использовались идентифицированные маркеры SNP в «пустыне генов», чтобы идентифицировать связь риска в каждой из областей с конкретной тканевой экспрессией. Хотя эти риски были успешно связаны с различными формами рака, Ghoussaini, M., et al. обратите внимание на их неуверенность в том, функционировали ли SNP просто как маркеры или были прямыми возбудителями рака.

Эти различные эффекты возникают из-за различных взаимодействий между SNP в этой области и промоторами MYC разных органов. Промотор MYC, расположенный на небольшом расстоянии ниже области 8q24, является, пожалуй, наиболее изученным онкогеном из-за его связи с множеством заболеваний. Нормальное функционирование промотора MYC обеспечивает регулярное деление клеток. Исследование предполагает, что область 8q, которая подверглась хромосомной транслокации у человека, могла переместить важный энхансер для промотора MYC. Эти области вокруг этого региона могли быть подвергнуты рекомбинации, которая могла скрыть существенный энхансер MYC в генной пустыне с течением времени, хотя его усиливающие эффекты все еще в значительной степени сохраняются. Этот анализ основан на ассоциациях болезней, наблюдаемых у нескольких видов мышей, у которых эта область сохраняется в непосредственной близости от промотора MYC. Таким образом, пустыня гена 8q24 должна была быть каким-то образом связана с промотором MYC. Пустыня напоминает стабильную генную пустыню, в которой после транслокации было очень мало рекомбинации. Таким образом, потенциальная гипотеза состоит в том, что SNP, влияющие на эту область, нарушают важные тканеспецифичные гены со стабильной генной пустыней, что может объяснить риски рака в различных тканевых формах. Этот эффект скрытых энхансерных элементов можно также наблюдать в других частях генома. Например, SNP в 5p13.1 дерегулируют кодирующую область PTGER4, что приводит к болезни Крона. Другой пораженный регион в пустыне гена 9p21 вызывает несколько заболеваний коронарной артерии. Однако ни одна из этих несущих риск генетических пустынь, по-видимому, не затронута так сильно, как области 8q24. Текущие исследования все еще не уверены в процессах, затронутых SNP в области 8q24, которые приводят к особенно усиленным ответам на промотор MYC. С помощью более доступной популяции и более специфических маркеров для картирования ассоциаций в масштабе всего генома все большее количество аллелей риска маркируется в генных пустынях, где небольшие, изолированные и, казалось бы, неважные участки генов могут модерировать важные гены.

Предостережение

Важно отметить, что, хотя большинство исследованных здесь генных пустынь являются существенными, вполне возможно, что большая часть содержимого генных пустынь по-прежнему может быть несущественной и одноразовой. Естественно, это не означает, что роли, которые играют генные пустыни, несущественны или не важны, скорее, чем их функции могут включать эффекты буферизации. Примером незаменимых генных пустынь с несущественным содержанием ДНК являются теломеры , защищающие концы геномов. Теломеры можно отнести к категории настоящих генных пустынь, учитывая, что они содержат только повторы TTAGGG (у людей) и не имеют явных функций кодирования белков. Без этих теломер геномы человека сильно мутировали бы в течение фиксированного числа клеточных циклов. С другой стороны, поскольку теломеры не кодируют белки, их потеря гарантирует отсутствие влияния на важные процессы. Следовательно, термин «мусорная» ДНК больше не следует применять к какой-либо области генома; каждая часть генома должна играть роль в защите, регулировании или восстановлении областей, кодирующих белок, которые определяют функции жизни. Хотя нам еще многое предстоит узнать об укромных уголках огромного (но ограниченного) генома человека, с помощью различных новых технологий и синтеза полного генома человека мы, возможно, сможем разгадать большую коллекцию секретов в приближающемся мире. лет о чудесах нашего генетического кода.

Смотрите также

использованная литература