Изучены правила трёхмерной организации генома у живых организмов с помощью нейросети

Отделение биологических наук

Биологические науки

Российские биоинформатики разработали нейросеть, которая позволила исследовать пространственную структуру генома у разных организмов — от грибов до млекопитающих, и научилась её предсказывать. Оказалось, что правила, по которым формируется трёхмерная архитектура генома, специфичны для видов.

Трёхмерная организация генома имеет важное значение для регуляции генов, поскольку взаимное расположение генов при пространственном сворачивании хроматина влияет на их активность. В 3D-структуре генома выделяют определённые паттерны, такие как петли (образуемые при точечном взаимодействии пар локусов); полосы (взаимодействия одного локуса с соседними областями); фонтаны, или струи (взаимодействия, исходящие из одного диагонального локуса); отсутствие взаимодействий между геномными областями называется инсуляцией. Эти паттерны встречаются у разных видов, но их визуальное сходство может не отражать сходство биологических механизмов, которые к ним приводят. Правила сворачивания хроматина могут различаться у разных видов. Большой шаг в изучении этой проблемы был сделан с появлением нейронных сетей, которые могут предсказывать пространственную структуру генома на основе последовательности ДНК.

Такое исследование было проведено российскими учёными и опубликовано в журнале Nucleic Acids Research. Авторы проанализировали данные по последовательности ДНК и по трёхмерной организации генома у 22 организмов, относящихся к очень разным таксономическим группам. Среди них — человек, мышь, лягушка, рыбка зебрафиш, брюхоногий моллюск, пчела, муравей, дрозофила, комар, клещ, нематода, гребневик, амёба, дрожжи, растение резуховидка Таля и другие.

Авторы разработали собственную модель машинного обучения Chimaera, в которую на вход закладывают последовательность ДНК, а на выходе она предсказывает карту трёхмерной организации генома. После того, как её обучили на данных 22 различных организмов, исследователи убедились в том, что модель позволяет количественно определять разные паттерны трёхмерной архитектуры, такие как петли, инсуляцию, фонтаны, у различных видов. Они находили отдельные мотивы в последовательности ДНК, связанные с формированием тех или иных паттернов. Так, инсуляция оказалась связана с обогащением последовательности ДНК GC-парами нуклеотидов (гуанин-цитозин).

Chimaera продемонстрировала важность положения генов для структуры хроматина у большинства изученных организмов, для этого исследователи использовали аннотации генов на базе данных Ensemble. Причём имеет значение не только расположение генов, но и их взаимная ориентация. По результатам своей работы они продемонстрировали, что существуют правила сворачивания хроматина, специфичные для каждого вида, то есть механизмы трёхмерной организации генома действительно видоспецифичны. Авторы подчёркивают, что главное преимущество разработанной ими модели перед другими состоит в возможности интерпретации изученных правил сворачивания хроматина. 

На основе выявленных закономерностей сворачивания хроматина авторам удалось установить эволюционные взаимосвязи и построить дерево трёхмерной организации генома, охватывающее живые организмы от растений до млекопитающих.

Источник: пресс-служба Института общей генетики им. Н.И. Вавилова РАН.

Новости Российской академии наук в Telegram →Новости Российской академии наук в Telegram →


Теги