Эксперты разработали новый статистический инструмент, который более точно определяет причинные гены и варианты заболевания и сокращает количество ложноположительных результатов.
Новый метод, causal-Transcriptome-wide Association studies (cTWAS), использует передовые статистические методы, объединяя данные из исследований общегеномных ассоциаций (GWAS) и прогнозируя генетическую экспрессию.
GWAS — распространенный метод, используемый для определения генов, связанных с различными заболеваниями. В качестве примера, он идентифицирует последовательности генома большого числа людей с определенным заболеванием по сравнению с последовательностями генома людей, у которых нет заболеваний.
Различия, наблюдаемые у людей с заболеваниями, могут подчеркнуть разницу в генах, которые могут повышать риск развития этого конкретного заболевания, что послужит поводом для дальнейших исследований.
Сложность заключается в том, что большинство заболеваний не являются результатом одной генетической вариации, скорее они вызваны сложным взаимодействием между несколькими генами, факторами окружающей среды и множеством других переменных.
Это означает, что GWAS может выделить ряд вариантов во многих областях генома, которые связаны с конкретным заболеванием. Однако он не определяет причинно-следственную связь.
Явление, называемое неравновесием сцепления, приводит к тому, что многие варианты в средней области генома сильно коррелируют друг с другом. Это связано с тем фактом, что ДНК передается блоками, а не отдельными генами.
Старший автор исследования, доктор Синь Хэ, доцент кафедры генетики человека Чикагского университета, объяснил: «У вас может быть много генетических вариантов в блоке, которые все коррелируют с риском заболевания, но вы не знаете, какой из них на самом деле является причинным вариантом.
«Это фундаментальная задача GWAS, то есть то, как мы переходим от ассоциации к причинно-следственной связи».
Уровни экспрессии генов используются для преодоления этих проблем. Локусы количественных признаков экспрессии (EQTL) — это генетические варианты, связанные с экспрессией генов.
Данные eQTL используются на основании того, что если вариант, связанный с заболеванием, является eQTL некоторого гена A, то A может быть связующим звеном между этим вариантом и заболеванием.
Проблема возникает, когда соседние варианты и eQTL разных генов могут быть связаны с eQTL гена A, непосредственно влияя на заболевание. Это приводит к ложноположительному результату.
Современные методы приводят к ложноположительным генам более чем в половине случаев.
Проблема привела к разработке нового метода, cTWAS, который уменьшает количество ложноположительных результатов за счет использования передовых статистических методов.
Он был создан профессором Хе и доктором Мэтью Стивенсом, профессором Ральфа У. Джерарда, заведующим кафедрами статистики и профессором генетики человека.
Этот новейший метод учитывает множество генов и вариантов, а не просто концентрируется на одном гене за раз. Это удаляет гены и варианты, которые мутят воду.
Профессор Хе сказал: «Если вы будете рассматривать по одному, у вас будут ложноположительные результаты, но если вы посмотрите на все близлежащие гены и варианты вместе, у вас гораздо больше шансов найти причинный ген.
«Программное обеспечение позволит людям проводить анализы, которые связывают генетические вариации с фенотипами. Это действительно ключевая задача, стоящая перед всей областью. Теперь у нас есть гораздо лучший инструмент для установления этих связей».