Международный проект HapMap - International HapMap Project

Международный проект HapMap является организацией , которая направлена на разработку гаплотип карты ( HapMap ) из генома человека , чтобы описать общие закономерности человеческой генетической изменчивости . HapMap используется для поиска генетических вариантов, влияющих на здоровье, болезни и реакцию на лекарства и факторы окружающей среды. Информация, полученная в рамках проекта, находится в свободном доступе для исследования.

Международный проект HapMap - это результат сотрудничества исследователей из академических центров, некоммерческих биомедицинских исследовательских групп и частных компаний в Канаде , Китае (включая Гонконг ), Японии , Нигерии , Великобритании и США . Официально он начался со встречи 27-29 октября 2002 г. и должен был продлиться около трех лет. Он состоит из двух этапов; полные данные, полученные на этапе I, были опубликованы 27 октября 2005 г. Анализ набора данных для этапа II был опубликован в октябре 2007 г. Набор данных для этапа III был выпущен весной 2009 г., а публикация с окончательными результатами была опубликована в сентябре 2010 г.

Задний план

В отличие от более редких менделевских заболеваний, комбинации различных генов и окружающей среды играют роль в развитии и прогрессировании общих заболеваний (таких как диабет , рак , болезни сердца , инсульт , депрессия и астма ) или в индивидуальной реакции на фармакологические препараты. агенты. Чтобы найти генетические факторы, участвующие в этих заболеваниях, можно в принципе провести исследование ассоциации в целом по геному : получить полную генетическую последовательность нескольких индивидуумов, у некоторых есть заболевание, а у некоторых нет, а затем искать различия между двумя наборами геномов. . В то время этот подход был невозможен из-за стоимости полного секвенирования генома . Проект HapMap предложил ярлык.

Хотя у любых двух неродственных людей примерно 99,5% последовательности ДНК , их геномы различаются в определенных местах нуклеотидов . Такие сайты известны как однонуклеотидные полиморфизмы (SNP), и каждая из возможных результирующих форм генов называется аллелем . Проект HapMap фокусируется только на общих SNP, где каждый аллель встречается как минимум в 1% населения.

У каждого человека есть две копии всех хромосом , кроме половых хромосом у мужчин . Для каждого SNP комбинация аллелей человека называется генотипом . Под генотипированием понимается определение генотипа человека в определенном месте. В рамках проекта HapMap была выбрана выборка из 269 человек, отобрано несколько миллионов четко определенных SNP, проведено генотипирование людей по этим SNP и опубликованы результаты.

Аллели близлежащих SNP на одной хромосоме коррелированы. В частности, если известен аллель одного SNP для данного человека, часто можно предсказать аллели ближайших SNP. Это связано с тем, что каждый SNP возник в истории эволюции как единичная точечная мутация , а затем передался по хромосоме в окружении других, более ранних точечных мутаций. SNP, которые разделены большим расстоянием на хромосоме, обычно не очень хорошо коррелированы, потому что рекомбинация происходит в каждом поколении и смешивает аллельные последовательности двух хромосом. Последовательность последовательных аллелей на определенной хромосоме называется гаплотипом .

Чтобы найти генетические факторы, влияющие на конкретное заболевание, можно поступить следующим образом. Сначала идентифицируется определенная интересующая область в геноме, возможно, из более ранних исследований наследования. В этой области можно найти набор тегов SNP из данных HapMap; это SNP, которые очень хорошо коррелируют со всеми другими SNP в регионе. Таким образом, изучение аллелей тегов SNP у человека с высокой вероятностью определит гаплотип этого человека. Затем определяют генотип этих тегов SNP у нескольких индивидуумов, у некоторых есть заболевание, а у некоторых нет. Сравнивая две группы, можно определить вероятные местоположения и гаплотипы, которые вовлечены в заболевание.

Использованные образцы

Гаплотипы обычно являются общими для разных популяций, но их частота может сильно различаться. Четыре группы населения было выбрано для включения в HapMap: 30 взрослые и-как-родителях йоруба тройки из Ибадана , Нигерия (YRI), 30 троек жителей штата Юта северной и западной европейской родословной (CEU), 44 не связанные между собой японских индивидуумов из Токио , Япония (JPT) и 45 неродственных китайцев хань из Пекина , Китай (CHB). Хотя гаплотипы, выявленные в этих популяциях, должны быть полезны для изучения многих других популяций, параллельные исследования в настоящее время изучают полезность включения дополнительных популяций в проект.

Все образцы были собраны в процессе взаимодействия с сообществом с соответствующим информированным согласием. Процесс взаимодействия с сообществом был разработан для выявления и попытки отреагировать на культурно специфические проблемы, а также для предоставления участвующим сообществам вклада в процессы получения информированного согласия и сбора образцов.

В фазе III были собраны 11 глобальных групп предков: ASW (африканское происхождение на юго-западе США); CEU (жители штата Юта северного и западноевропейского происхождения из коллекции CEPH); CHB (ханьские китайцы в Пекине, Китай); CHD (китайский в столичном Денвере, штат Колорадо); GIH (индейцы гуджарати в Хьюстоне, штат Техас); JPT (японский язык в Токио, Япония); LWK (Лухья в Вебуе, Кения); MEX (мексиканские корни в Лос-Анджелесе, Калифорния); MKK (масаи в Киньяве, Кения); TSI (тосканцы в Италии); YRI (Йоруба в Ибадане, Нигерия).

Фаза Я БЫ Место Население Деталь
I / II CEU Соединенные Штаты Жители Юты северного и западноевропейского происхождения из коллекции CEPH Деталь
I / II CHB Китай Хань китайский в Пекине , Китай Деталь
I / II JPT Япония Японский в Токио , Япония Деталь
I / II YRI Нигерия Йоруба в Ибадане , Нигерия Деталь
III ASW Соединенные Штаты Африканское происхождение на юго-западе США Деталь
III CHD Соединенные Штаты Китайский в столичном Денвере , Колорадо , США Деталь
III GIH Соединенные Штаты Индейцы гуджарати в Хьюстоне , штат Техас , США Деталь
III LWK Кения Лухья в Вебуе , Кения Деталь
III MKK Кения Масаи в Киньяве , Кения Деталь
III MXL Соединенные Штаты Мексиканские корни в Лос-Анджелесе , Калифорния , США Деталь
III TSI Италия Тоскани в Италии Деталь

Также были созданы три комбинированные панели, которые позволяют лучше идентифицировать SNP в группах за пределами девяти однородных выборок: CEU + TSI (комбинированная панель жителей Юты северного и западноевропейского происхождения из коллекции CEPH и тосканцев в Италии); JPT + CHB (объединенная панель японского языка в Токио, Япония и китайская хань в Пекине, Китай) и JPT + CHB + CHD (объединенная панель японского языка в Токио, Япония, китайская хань в Пекине, Китае и китайская в столичном Денвере, Колорадо) . CEU + TSI, например, является лучшей моделью для британских британцев, чем только CEU.

Научная стратегия

В 1990-е годы секвенировать полные геномы пациентов было дорого. Поэтому Национальные институты здравоохранения поддержали идею «ярлыка», который заключался в том, чтобы смотреть только на те участки генома, где у многих людей есть вариантная единица ДНК. Теория, лежащая в основе кратчайшего пути, заключалась в том, что, поскольку основные заболевания распространены, также могут быть генетические варианты, которые их вызывают. Теория утверждала, что естественный отбор сохраняет в геноме человека варианты, которые наносят вред здоровью до того, как дети вырастут, но не справляется с вариантами, которые появляются в более позднем возрасте, что позволяет им стать довольно распространенными (в 2002 году Национальный институт здравоохранения начал проект стоимостью 138 миллионов долларов называется HapMap, чтобы каталогизировать общие варианты в геномах Европы, Восточной Азии и Африки).

Для фазы I один общий SNP был генотипирован каждые 5000 оснований. Всего было генотипировано более одного миллиона SNP. Генотипирование проводилось 10 центрами с использованием пяти различных технологий генотипирования. Качество генотипирования оценивалось с использованием дублирующих или связанных образцов и путем периодических проверок качества, когда центры должны были генотипировать общие наборы SNP.

Канадскую команду возглавил Томас Дж. Хадсон из Университета Макгилла в Монреале и сосредоточил внимание на хромосомах 2 и 4p. Китайская команда во главе с Huanming Ян в Пекине и Шанхае , и Lap-Чи Цуй в Гонконге и сосредоточены на хромосомах 3, 8P и 21. Японская команда во главе с Юсуке Накамура в Университете Токио и сосредоточены на хромосомах 5, 11, 14, 15, 16, 17 и 19. Британская группа под руководством Дэвида Р. Бентли из Института Сэнгера сосредоточила свое внимание на хромосомах 1, 6, 10, 13 и 20. В США было четыре центра генотипирования: a группа под руководством Марка Чи и Арнольда Олифанта из Illumina Inc. в Сан-Диего (изучает хромосомы 8q, 9, 18q, 22 и X), группа под руководством Дэвида Альтшулера и Марка Дейли из Института Броуда в Кембридже, США (хромосомы 4q, 7q, 18p, Y и митохондрии ), команда во главе с Ричардом Гиббсом в Бейлор медицинского колледжа в Хьюстоне (хромосома 12), и команда во главе с Пуй-Ян Квок в университете Калифорнии, Сан - Франциско (хромосома 7р).

Чтобы получить достаточно SNP для создания карты, Консорциум профинансировал большой проект повторного секвенирования, чтобы обнаружить миллионы дополнительных SNP. Они были отправлены в общедоступную базу данных dbSNP . В результате к августу 2006 г. база данных включала более десяти миллионов SNP, и более 40% из них были известны как полиморфные . Для сравнения, в начале проекта было идентифицировано менее 3 миллионов SNP, и не более 10% из них были известны как полиморфные.

Во время фазы II более двух миллионов дополнительных SNP были генотипированы по всему геному Дэвидом Р. Коксом, Келли А. Фрейзер и другими из Perlegen Sciences и 500 000 - компанией Affymetrix .

Доступ к данным

Все данные, полученные в рамках проекта, включая частоты SNP, генотипы и гаплотипы , были размещены в открытом доступе и доступны для скачивания. Этот веб-сайт также содержит браузер генома, который позволяет находить SNP в любой интересующей области, их частоты аллелей и их связь с ближайшими SNP. Также предоставляется инструмент, который может определять SNP тегов для заданной области интереса. К этим данным также можно получить прямой доступ из широко используемой программы Haploview .

Публикации

Смотрите также

Рекомендации

Внешние ссылки