Кто, где и как секвенирует людей? Национальные проекты по сбору биологической, генетической и медицинской информации
В наше время исследования в области биологии невозможны без использования больших объемов данных. Секвенируют уже не единичные геномы людей, а сотни тысяч и миллионы. Для того, чтобы собрать, обработать, анализировать и хранить эти данные, создаются национальные и международные проекты. В них входят и государственные структуры, и биобанки, и коммерческие компании. Расскажем подробнее о самых крупных и интересных проектах.
123rf.com
Геномы людей в наше время секвенируют многие. Этим занимаются крупные научно-исследовательские центры, государственные структуры в рамках национальных программ, биобанки (репозитории биологических образцов) и коммерческие компании. Мы отобрали только самые крупные или интересные по другим причинам проекты. Основные данные о каждом из них собраны в таблице.
Великобритания
UK Biobank — это очень крупное популяционное проспективное исследование, созданное для детального анализа генетических и негенетических факторов, влияющих на заболевания среднего и пожилого возраста. Проект зародился еще в начале 2000-х, но официальное привлечение участников проходило с 2006 по 2010 год. Около 500 тысяч человек в возрасте 40–69 лет проходили осмотр, сдавали анализы (кровь, мочу, слюну) и отвечали на вопросы о диете, физической активности, семейной истории. Многие прошли МРТ-обследование головы, сердца и брюшной полости или собирали данные о здоровье с помощью носимых устройств. Были проанализированы протеомы и метаболомы некоторых участников. Вместе с электронными медицинскими записями база данных проекта стала одной из самых полных, и она продолжает пополняется новой информацией об участниках.
В рамках проекта выполнены многочисленные полногеномные поиски ассоциаций (GWAS) на разные признаки. Генетические данные были получены с помощью ДНК-микрочипов, полноэкзомного и полногеномного секвенирования. В августе 2025 года сообщалось, что секвенированы полные геномы 490 640 участников проекта со средним покрытием 32,5x.
На данных UK Biobank выполнено множество исследований. В PubMed по запросу «UK Biobank» можно найти почти 18 тысяч публикаций. Как британские, так и иностранные исследователи могут подать заявку на доступ к базе. Так, были получены интересные результаты о связи генетических локусов с сердечно-сосудистыми заболеваниями, ожирением и диабетом 2 типа. Анализ МРТ-снимков дал новую информацию о нейродегенеративных заболеваниях. Многие исследования анализируют влияние образа жизни и генетических факторов на здоровье участников.
Исследователи, подающие заявку на доступ к базе данных, должны продемонстрировать, что у них есть научная цель, соответствующая главной цели проекта — улучшению показателей здоровья.
Есть несколько моментов, вызывающих критику. Так, участники не получают информацию о своем генотипе, в том числе связанную с повышенным риском развития заболеваний. По мнению руководителей проекта, многие генетические маркеры еще не были должным образом валидированы, поэтому информация о носительстве может вызвать необоснованный стресс или необоснованную успокоенность. Однако с развитием генетического тестирования все больше специалистов считает, что эта информация может быть ценной для участников, если будет дополнена генетическим консультированием.
Также проект дает доступ к базе фармацевтическим компаниям. Они могут предоставить ценные ресурсы и опыт. Но полученные открытия в первую очередь должны служить интересам общественного здравоохранения, а не только быть инструментом для получения прибыли.
Не так давно в СМИ обсуждалась утечка данных проекта. По-видимому, причина утечки — не сам биобанк, а ученые, получившие доступ к информации, которые невнимательно отнеслись к вопросам безопасности. Данные, оказавшиеся в общем доступе, не содержали имен участников, но по косвенным признакам журналистам удалось идентифицировать некоторых из них. Эксперты сомневаются, что «утекшие» данные удастся вернуть под контроль проекта, но теперь ученые, которые собираются работать с данными UK Biobank, проходят дополнительное обучение.
Credit: 123rf.com
США
Исследовательская программа Национальных институтов здравоохранения All of Us была запущена в 2018 году. Запланировано участие более 1 млн человек, в 2026 году к участию в программе привлекли уже 870 тысяч человек. Упор сделан на этническое и социальное разнообразие. В 2021 году 86% генетических исследований было выполнено на людях европейского происхождения (в 2016 — 81%), при этом, например, перенести полигенные индексы риска на другие популяции часто бывает невозможно. В программе All of Us 80% участников относятся к исторически недостаточно представленным группам по этнической принадлежности, возрасту, месту проживания, уровню дохода и образования, доступу к здравоохранению и наличию инвалидности.
В программу включены ответы на опросники, электронные медицинские карты, последовательности генома и записи носимых устройств. Доступ к данным осуществляется через облачную среду Researcher Workbench. Она содержит три уровня доступа: публичный, для зарегистрированных пользователей и контролируемый. На контролируемом уровне геномные данные доступны исследователям, подписавшим соглашение об использовании данных. В 2025 году таких исследователей было уже 17 тысяч, как из США, так и из тысячи организаций по всему миру.
В 2025 году исследователи получили доступ к более 414 тысячам полным геномам участников. Было обнаружено более 275 миллионов ранее не зарегистрированных генетических вариантов. Более 220 тысяч участников программы получили результаты индивидуальных исследований ДНК, включая данные об их генетическом происхождении и информацию, связанную со здоровьем.
Trans-Omics for Precision Medicine (TOPMed) — это программа Национального института сердца, легких и крови (NHLBI), входящего в состав Национальных институтов здравоохранения. Ее цель — улучшение понимания фундаментальных биологических процессов, лежащих в основе сердечно-сосудистых, легочных и гематологических заболеваний, а также расстройств сна; развитие персонализированной медицины, позволяющей создавать методы лечения заболеваний, адаптированные к уникальным генетическим особенностям и факторам окружающей среды человека. Программа была запущена в 2014 году.
Данные, полученные с помощью полногеномного секвенирования и других омиксных технологий, интегрируют с молекулярными и клиническими данными. TOPMed также собирает данные об окружающей среде и поведении, такие как пищевые привычки, физическая активность и социально-экономические факторы.
Программа TOPMed предоставляет данные для исследователей, изучающих сердечно-сосудистые, легочные и гематологические заболевания и расстройства сна. Этот ресурс включают различные типы геномных и других данных, полученных в результате полногеномного и полноэкзомного секвенирования, секвенирования РНК, анализа эпигенома, метаболома и протеома в ходе предыдущих исследований, финансируемых Национальным институтом сердца, легких и крови. Доступны результаты секвенирования 180 тысяч полных геномов.
Million Veteran Program — это проспективное когортное исследование и мега-биобанк в системе здравоохранения Министерства по делам ветеранов, предназначенный для изучения влияния генетики на здоровье среди бывших военнослужащих США. Набор участников начался в 2011 году.
Основные направления исследований:
-
поиск методов профилактики и лечения посттравматического стрессового расстройства, депрессии и тревожности;
-
изучение факторов риска различных видов сердечно-сосудистых заболеваний и рака;
-
изучение других заболеваний, включая диабет, болезнь Альцгеймера, эндометриоз и остеоартрит.
Было проведено генотипирование более миллиона образцов с помощью специализированного чипа Axiom (ThermoFisher). Завершено полногеномное секвенирование примерно 190 тысяч образцов, 102 тысяч геномов доступны для исследований, а остальные проходят контроль качества перед публикацией. Еще 80 тысяч образцов проанализированы на метилирование ДНК.
У этой когорты существует перекос в сторону мужчин.
В 2025 году сообщалось о проблемах, с которыми столкнулось исследование из-за снижения финансирования, запрета на найм новых работников и продление существующих контрактов.
Credit: 123rf.com
Финляндия
FinnGen — это исследовательский проект в области геномики и персонализированной медицины, результат партнерства государственных и частных институтов, в рамках которого были собраны и проанализированы геномные и медицинские данные более 520 тысяч человек (почти 10% населения страны). Целью проекта изначально было понимание генетической основы заболеваний и использование этого понимания для разработки методов лечения. В настоящее время FinnGen расширяет свою деятельность, изучая прогрессирование и биологические механизмы заболеваний. В проект включены не только генетические, но и другие омиксные данные (протеомика, метаболомика и т. д.).
Медиана возраста участников на момент сбора образцов — 53 года, образцы собирали финские биобанки. В когорту намеренно включено непропорционально большое количество людей с различными заболеваниями, которых рекрутировали в том числе в специализированных больницах.
Можно выделить три категории участников проекта FinnGen: образцы около 200 тысяч человек были собраны с 1980-х годов до запуска проекта в 2017 году, образцы еще 300 тысяч человек собраны биобанками после начала проекта, образцы 58 тысяч человек принадлежали донорам крови и представляли собой в основном здоровые контроли.
Генетические данные FinnGen хранятся в защищенной вычислительной среде FinnGen Sandbox, которая предоставляет исследователям удаленный доступ к данным.
Генетические данные были по большей части получены с помощью чипа, который содержит 723 376 наборов зондов для 664 510 генетических маркеров. Небольшая часть генетических данных (для 8700 человек) была получена с помощью полногеномного секвенирования.
Будучи изолированной популяцией, финны отличаются более однородным генетическим составом, чем население многих других стран. Редкие и низкочастотные варианты в финской популяции могут достигать сравнительно высокой частоты. Это дает исследователям уникальные возможности для выявления новых генетических ассоциаций с заболеваниями, которые было бы трудно или невозможно обнаружить в других популяциях. Так, были выявлены ассоциации определенных вариантов со снижением фертильности, контрактурой Дюпюитрена («болезнью викингов»), диабетом.
Эстония
Estonian Biobank — это национальный биобанк, находящийся в Институте геномики Тартуского университета, один из крупнейших в мире. Он был создан в 2000 году.
В биобанке хранятся информация и биологический материал около 210 тысяч участников — это примерно 20% взрослого населения Эстонии. Медицинская информация периодически пополняется из национальных реестров.
Всех участников генотипировали с помощью чипа Global Screening Array (Illumina), у 2500 были секвенированы экзомы, у 3000 — полные геномы с высоким покрытием.
Для полногеномного исследования участников выбирали по месту рождения, что позволило повысить генетическое разнообразие. В результате выявили 1900 предполагаемых вариантов с потерей функции, которые не были отмечены в других популяциях.
Одна из отличительных особенностей базы данных — большое количество родственников среди участников (в среднем 13 родственников каждого из них сами являются участниками программы). Доступны также омиксные данные, в частности, по метаболому и микробиому.
Эстонский биобанк позволяет исследовать вклады в развитие полигенных заболеваний как генов, так и факторов окружающей среды и образа жизни. Целью биобанка заявлено содействие развитию персонализированной медицины в Эстонии путем дополнения важной информации о пациенте его геномными данными.
Биобанк активно используют исследователи по всему миру. Юридические и социальные вопросы биобанкинга и его использование охвачены Законом Эстонии об исследованиях генов человека. Работу биобанка финансирует правительство Эстонии за счет бюджетов министерства социальных дел и министерства образования и исследований, а также международные гранты Европейской комиссии и других организаций.
Еще одна заявленная цель проекта — помощь другим странам Восточной Европы в создании своих биобанков. Эстонский биобанк входит в европейский консорциум BBMRI, целью которого является подготовка к созданию общеевропейской инфраструктуры на основе существующих биобанков и биомолекулярных ресурсов.
Нидерланды
Lifelines, биобанк и лонгитюдная когорта, объединяющая несколько поколений, основана в 2006 году. Когорта включает в себя более 167 тысяч участников, или 10% населения трех северных провинций Нидерландов. Многие участники — родственники. Первоначально было охвачено до трех поколений одной семьи, в последнее время появляются данные по четвертому поколению (Lifelines NEXT). Цель Lifelines — стать ресурсом для национального и международного научного сообщества, в первую очередь для изучения здорового старения.
Участники Lifelines раз в 4–5 лет проходят медицинские осмотры, у них собирают кровь и мочу, они заполняют анкеты, связанные со здоровьем и образом жизни. В перерывах между оценками рассылаются контрольные анкеты. Дополнительный углубленный сбор данных по различным темам проводится по запросу исследователей, часто в определенных подгруппах. Геномы около 50 тысяч человек были проанализированы с помощью чипов, 165 — с помощью полногеномного секвенирования (на 2022 год).
Credit: 123rf.com
Исландия
Биофармацевтическая компания deCODE genetics (с 2012 года — дочерняя компания Amgen) была основана в Исландии еще в 1996 году, до завершения проекта «Геном человека». Ее целью было выявление вариаций генома человека, связанных с распространенными заболеваниями, и применение этих открытий «для разработки новых методов выявления, лечения и предотвращения заболеваний».
С тех пор компания собрала огромное количество популяционных данных по генеалогии, генотипам и фенотипам. В исследованиях компании участвует более 160 тысяч человек, то есть больше половины взрослого населения Исландии. К 2022 году были генотипированы 155 250 человек с помощью чипа от Illumina, полные геномы 58 тысяч были секвенированы (2023). Собранную информацию компания использовала для выявления ключевых генов, связанных с распространенными заболеваниями и реакциями на лекарственные препараты. deCODE картировала гены более чем при 25 распространенных полигенных заболеваниях и идентифицировала гены при восьми из них.
Credit: 123rf.com
Китай
China Kadoorie Biobank — это проспективное когортное исследование британских и китайских ученых. Оно включает данные более 512 тысяч взрослых мужчин и женщин 30–79 лет, привлеченных в период с 2004 по 2008 год из 10 регионов Китая (5 городских и 5 сельских). Проект финансируется благотворительным фондом, основанным семьей бизнесменов и филантропов из Гонконга Кадури.
При наборе участники заполняли опросник и проходили осмотр. Некоторых людей тестировали повторно в 2008, 2013 и 2020 гг. Информацию о заболеваниях и смерти участников получают из национальной системы здравоохранения и специальных регистров.
-
оценить роль как установленных, так и новых факторов риска в этиологии широкого спектра хронических неинфекционных заболеваний, таких как болезни сердца, инсульт, диабет и рак;
-
определить сложное взаимодействие между генами, образом жизни и факторами окружающей среды, влияющее на риски развития основных хронических заболеваний;
-
изучать и выявлять новые биологические механизмы, связывающие конкретные факторы риска с различными заболеваниями, и использовать эти данные для разработки новых методов лечения.
Большая часть подобных исследований проводится на людях европейского происхождения, так что China Kadoorie Biobank призван исправить этот перекос.
Более 100 тысяч участников генотипировали с помощью сделанного на заказ микрочипа Axiom. В 2025 году сообщили о завершении полногеномного секвенирования всех участников проекта в рамках государственно-частного партнерства.
Япония
Проект BioBank Japan был запущен в 2003 году, чтобы продемонстрировать перспективность персонализированной медицины. Проект реализовывался в несколько этапов.
С 2003 по 2008 год сформировали первую когорту из пациентов 66 больниц по всей Японии — около 200 тысяч человек, у которых было диагностировано одно из 47 целевых заболеваний. С 2012 по 2017 год набрали вторую когорту, включающую около 67 тысяч новых участников с одним или несколькими из 38 целевых заболеваний (34 представленных в первой когорте плюс 4 новых). Среди изучаемых патологий — диабет, инфаркт миокарда, цирроз печени, эндометриоз, атопический дерматит и различные виды рака.
Участники проходят очное собеседование, а также физическое или биологическое обследование (например, анализ крови, слюны, походки, измерение силы хвата, антропометрические измерения). Затем их продолжают наблюдать, проводя дополнительные опросы и собирая медицинские данные. Среднее время наблюдения за участниками — более 10 лет.
На 2025 год секвенировали полные геномы 16 тысяч пациентов, а SNP выявили у 270 тысяч. Одновременно с этим проводятся геномные и омиксные анализы.
Южная Корея
Korean Genome and Epidemiology Study — консорциум из шести проспективных когортных исследований (KoGES_Ansan and Ansung study, KoGES_HEXA, KoGES_CAVAS, KoGES_twin and family study, KoGES immigrant study и KoGES emigrant study).
Цель проекта KoGES:
-
создание платформы для эпидемиологических исследований генома, включающей базу данных по здоровью и биобанк;
-
изучение генетической и экологической этиологии распространенных сложных заболеваний у корейцев (например, сахарный диабет 2 типа, гипертония, ожирение, метаболический синдром, остеопороз, сердечно-сосудистые заболевания и рак) и причин смерти с долгосрочным наблюдением.
-
разработка всеобъемлющих и применимых рекомендаций по оказанию медицинской помощи при распространенных сложных заболеваниях у корейцев, снижении бремени хронических заболеваний и улучшении качества жизни.
С 2001 по 2013 гг. к участию в проекте привлекли 245 тысяч участников. Они отвечали на опросники (с повторами каждые 2–4 года), проходили осмотры. Десятки тысяч участников были генотипированы.
Африка
Human Heredity and Health in Africa (H 3Africa ) — инициатива по изучению геномики и медицинской генетики населения африканского континента. Это совместный проект Национальных институтов здравоохранения США, Африканского общества генетики человека и фонда Wellcome Trust в рамках Альянса за ускорение развития науки в Африке (AESA).
Консорциум H3Africa был официально создан в 2012 году в Аддис-Абебе, затем расширился, включив в себя исследовательские проекты в 32 странах.
H3Africa оказывал поддержку трем региональным биобанкам, расположенным в Нигерии (Западная Африка), Уганде (Восточная Африка) и ЮАР. Их целью было хранение образцов ДНК участников, привлеченных к нескольким исследованиям H3Africa.
Данные многих исследований H3A были загружены в общедоступные репозитории, такие как EGA и dbGAP. Эти наборы включают генетические данные, полученные с помощью ДНК-чипов (около 35 800 образцов), полные экзомные последовательности (около 1850 образцов), метагеномные последовательности микробиома кишечника (около 2000 образцов), полные геномные последовательности (около 920 образцов) и данные метилирования (59 образцов).
Основное финансирование консорциума H3Africa завершилось в 2023 году, но продолжают работать многие инфраструктуры и нормативно-правовые рамки, созданные консорциумом.
Credit: 123rf.com
Катар
Qatar Genome Programme — это национальный проект, целью которого является изучение генетического состава населения Катара, а также других арабских популяций, и создание масштабных геномных баз данных для исследователей.
В основе программы лежит Катарский биобанк, основанный в 2012 году. Сама программа была запущена в 2015 году, теперь она часть Катарского института прецизионного здравоохранения (Qatar Precision Health Institute). Проект направлен на внедрение методов прецизионной медицины и персонализированного здравоохранения в национальную систему здравоохранения.
В 2021 году программа опубликовала свое первое полногеномное ассоциативное исследование, охватывающее 45 клинически значимых признаков. В 2023 году сообщалось о секвенировании 30 тысяч геномов граждан Катара. Теперь их число выросло до 40 тысяч.
Россия
Национальная генетическая инициатива «100 000+Я»
В России существует национальная генетическая инициатива «100 000+Я», которая направлена на улучшение методов диагностики и лечения наследственных и онкологических заболеваний. Цель Инициативы – определить генотипы 100 тысяч россиян из разных географических регионов и популяций для поиска генетических вариантов, которые встречаются на территории России, обобщения их сходства и выявления различий.
Проект «100 000+Я» реализуется центром « Биотехнологический кампус» в рамках Федеральной научно-технической программы развития генетических технологий, основным технологическим партнером которой является ПАО «НК «Роснефть». Работники компании и их совершеннолетние родственники (до 10 человек) могут стать участниками пилотной части проекта.
Работы по формированию базы ведутся с с конца 2022 года. Первое массовое взятие крови началось в марте 2023 года, а первая тысяча геномов была получена уже в апреле того же года.
В 2025 году сообщалось, что «Биотехнологический кампус» выполнил план по сбору биоматериалов в рамках инициативы «100 000+Я». Общее количество образцов превысило 100 тысяч, из которых более 80 тысяч уже расшифрованы и внесены в базу данных проекта.
Центр сотрудничает с ведущими медико-генетическими исследовательскими центрами, среди которых: НМИЦ детской гематологии, онкологии и иммунологии им. Дмитрия Рогачева, Российский научный центр хирургии им. Академика Б.В. Петровского, Медико-генетический научный центр им. Академика Н.П. Бочкова, Уфимский федеральный исследовательский институт и многие другие.
Подробнее о проекте — на PCR.NEWS.
Константин Северинов, научный руководитель национальной генетической инициативы «100 000 + Я», сказал в недавнем интервью: «Соглашение с правительством продлено до конца 2030 года. Если все сложится, мы будем просто наращивать базу до одного миллиона геномов. То есть в базе будут храниться и анализироваться геномы почти 1% населения России».
«База данных популяционных частот генетических вариантов населения Российской Федерации» разработана в ФМБА России. Она является одной из крупнейших в мире, включает результаты полногеномного секвенирования 120 тысяч человек и содержит информацию о более чем 550 млн уникальных генетических вариантов и их встречаемости в российской популяции. Эти люди — жители 85 регионов России. Информация была получена в ходе популяционных исследований. На конференции «Молекулярная диагностика 2025» об этой базе рассказывал Михаил Иванов из Центра стратегического планирования и управления медико-биологическими рисками здоровью ФМБА России.
Создание базы было необходимо для лучшего понимания распространенности генетических вариантов в российской популяции и для создания методов персонализированной прецизионной медицины. Получить доступ к базе могут как физические лица, та и представители организаций.
Биобанки мира
|
Проект |
Сколько человек входит в программу |
Заявленные цели |
Генотипировано с помощью чипов (дата)
|
Полных геномов прочитано (дата) |
|---|---|---|---|---|
|
UK Biobank (Великобритания) |
500 000 |
Улучшение профилактики, диагностики и лечения серьезных и угрожающих жизни заболеваний, включая рак, сердечно-сосудистые заболевания, инсульт, диабет, артрит, остеопороз, заболевания глаз, депрессию и различные формы деменции. |
488 000 (2025) |
490 640 (2025) |
|
All of Us (США) |
870 000 |
Ускорение научных исследований и развитие персонализированной медицины, создание базы с высоким этническим и социальным разнообразием. |
447 000 (2025) |
414 000 (2025) |
|
TOPMed (США) |
180 000 |
Улучшение понимания фундаментальных процессов, лежащих в основе сердечно-сосудистых, легочных и гематологических заболеваний, а также расстройств сна; развитие персонализированной медицины |
- |
180 000 |
|
Million Veteran Program (США) |
>1 000 000 |
Изучение влияния генетики на здоровье среди бывших военнослужащих США |
>1 000 000 |
190 000 |
|
FinnGen (Финляндия) |
520 000 |
Улучшение понимания генетической основы заболеваний и использование этого понимания для разработки методов лечения. |
520 000 |
8700 (2024) |
|
Estonian Biobank (Эстония) |
210 000 |
Продление здоровой жизни граждан |
210 000 |
3000 |
|
Lifelines (Нидерланды) |
167 000 |
Исследование развития хронических и редких заболеваний, а также факторов риска их возникновения с целью улучшения здоровья граждан. |
50 000 (2022) |
165 (2022) |
|
deCODE genetics (Исландия) |
160 000 |
Выявление вариаций генома, связанных с распространенными заболеваниями, разработка методов диагностики, лечения и профилактики |
155 000 (2022) |
58 000 (2023) |
|
China Kadoorie Biobank (Китай) |
512 000 |
Изучение генетических, связанных с образом жизни и экологических причины распространенных хронических заболеваний в китайской популяции для улучшения их профилактики, лечения и контроля. |
100 000 (2023) |
512 000 (2025) |
|
BioBank Japan (Япония) |
270 000 |
Развитие персонализированной медицины. |
270 000 (2025) |
16 000 (2025) |
|
Korean Genome and Epidemiology Study (Южная Корея) |
245 000 |
Разработка рекомендаций по оказанию медицинской помощи при распространенных сложных заболеваниях среди корейцев, снижение бремени хронических заболеваний. |
28 000 (2015) |
- |
|
H3Africa (Африка) |
100 000 |
Создание научно-исследовательской инфраструктуры континента, подготовка исследователей и врачей, изучение вопросов, представляющих научный и медицинский интерес для африканцев. |
35 800 |
920 |
|
Qatar Genome Programme (Катар) |
40 000 |
Изучение генетического состава населения Катара, а также других арабских популяций, создание геномных баз данных для исследовательских целей. |
- |
40 000 |
|
100 000+Я (Россия) |
>100 000 |
Определить генотипы 100 тысяч россиян из разных регионов и популяций для поиска генетических вариантов, которые встречаются в России, обобщения их сходства и выявления различий. |
- |
80 000 |
|
База данных популяционных частот генетических вариантов населения Российской Федерации |
120 000 |
Лучшее понимание распространенности генетических вариантов в российской популяции и создание методов персонализированной прецизионной медицины. |
- |
120 000 |
Меню
Все темы
0





