Y-хромосому дочитали до конца

…и оказалось, что она не только весьма отличается от мужчины к мужчине, но и успела оставить след во множестве бактериальных геномов.

В прошлом году мы писали, что человеческий геном дочитали до конца — спустя почти двадцать лет после завершения проекта «Геном человека». Дело в том, что после «Генома человека» в нашей ДНК непрочитанными остались около 200 млн нуклеотидов, то есть генетических букв. Пропустили их тогда не просто так — эти 200 млн состоят преимущественно из повторов. Повторы могут быть разные по длине и по последовательности, но для того, чтобы понять, в каком месте хромосомы они находятся, и сколько раз повторяется та или иная последовательность, и есть ли в повторах какие-то вариации и где именно — чтобы всё это понять, нужно уметь прочитывать за один раз длинные куски ДНК. А во времена проекта «Геном человека» читать, то есть секвенировать длинные фрагменты нуклеиновых кислот было как минимум непросто.

К прошлому году пробел в человеческом геноме как будто закрыли, однако с одной оговоркой насчёт Y-хромосомы. Очень долго из неё знали только половину, то есть около 30 млн нуклеотидов из 60 с лишним. Другую половину в молекулярно-химическом смысле прочли тоже к прошлому году, но нужно было ещё собрать уже известные последовательности и новопрочитанные фрагменты ДНК в единую хромосому. И вот сейчас Nature сообщает, что и эта работа окончена.

Тут нужно сделать ещё одно уточнение: человеческую Y-хромосому собирали из нескольких десятков индивидуальных «игреков». Мы опять же рассказывали, почему для полноты генома важно прочесть ДНК от многих особей — потому что у разных особей в геноме могут быть те или иные варианты последовательности, которые, однако, остаются в пределах нормы. Геном, построенный с учётом таких вариантов, называют референсным. Он не соответствует никакой индивидуальной ДНК — это массив данных, в котором записаны варианты последовательностей в том или ином фрагменте генома многих людей (если мы говорим о людях). Поскольку все люди разные, можно подумать, что для референсного генома нужно прочесть ДНК всех людей на земле. Но так думать не нужно. Наши индивидуальные отличия — они видны хотя бы по внешности — действительно бесконечно разнообразны, но они складываются из вариантов, которые встречаются в конкретных участках генома. А когда речь идёт о конкретных последовательностях, то вариантов у них уже может быть немного.

Например, возьмём какой-нибудь ген, который, как и любые другие гены, составлен последовательностью четырёх генетических букв — азотистых оснований ДНК. Буквы могут меняться одна на другую, но, во-первых, букв всего четыре, а во-вторых, если мы говорим о здоровых вариантах гена, то далеко не во всей последовательности они могут варьировать. Кое-где замены приведут к такому варианту гена, с которым человек просто не выживет. То же самое касается других мутаций, когда в гене появляются вставки небольших последовательностей, выпадения, обращения и т. д. Но, так или иначе, чтобы поймать здоровые вариации человеческого генома, нужна ДНК не от одного человека. И сейчас белые пятна в «общечеловеческой» Y-хромосоме закрывали с помощью «игреков» от сорока трёх мужчин со всех концов света.

Оказалось, что Y-хромосома необычайно разнообразна. Например, давно известно, что на ней находится ген TSPY, участвующий в формировании сперматозоидов. Как это порой бывает с генами, он размножился в несколько копий, причём несколько — это ещё мягко сказано: у кого-то гена TSPY может быть тридцать девять экземпляров. И то же время, если взять чью-нибудь другую Y-хромосому, то на ней будет всего двадцать три копии TSPY. Другой ген, TSPY2, тоже имеющий отношение к сперматогенезу, у разных людей будет располагаться в разных участках «игрека», хотя обычно внутригеномная «прописка» у генов более-менее постоянна. В будущем предстоит ещё выяснить, одинаково ли работают все эти многочисленные копии TSPY, и как влияет на физиологию разное их количество, и как ведёт себя TSPY2 в зависимости от положения на хромосоме.

В геноме повторяются не только «осмысленные», белок-кодирущие гены. Чаще о повторах говорят в связи с участками ДНК, которые ничего не кодируют. Такие участки могут быть очень и очень велики, и обычно они запечатаны в архиве специальными белками-упаковщиками, то есть доступ к этим повторам со стороны каких-то клеточных молекул сильно затруднён. Притом у них есть свои функции; например, из таких бессмысленных повторов состоят очень важные участки хромосом, называемые центромерами и теломерами. Оказалось, что такие некодирующие зоны из множества повторов у разных мужчин тоже могут отличаться — на миллионы, а то и на десять и даже на двадцать миллионов генетических букв. И в то же время у отдельного человека размер такой некодирующей зоны может уменьшаться просто с возрастом. В перспективе опять же предстоит выяснить, что всё это значит.

Наконец, с полностью прочитанной Y-хромосомой выяснилась одна отчасти забавная вещь — множество бактериальных геномов загрязнены последовательностями «игрека». Но если кто-то подумал про горизонтальный перенос генов от человека к бактериям, то нет, тут всё проще. Дело в том, что образцы бактерий, чей геном хотели прочесть, часто брали от человека. Вместе с бактериями в процедуру секвенирования попадала и человеческая ДНК. Человеческую ДНК от разных других наших хромосом можно было быстро отличить от бактериальной — потому что почти все наши хромосомы были уже очень хорошо прочитаны. Ну а «игрек» так и оставался сильно недочитанным. Биоинформатические алгоритмы, собирая бактериальный геном, вставляли «игрек»-фрагменты в бактериальную ДНК, туда, где их можно было смонтировать с соседними бактериальными последовательностями. Суда по базе данных бактериальных геномов, Y-хромосома «наследила» в геномах примерно 5 тысяч видов. Но теперь, надо думать, её оттуда быстро вычистят.

Автор: Кирилл Стасевич


Портал журнала «Наука и жизнь» использует файлы cookie и рекомендательные технологии. Продолжая пользоваться порталом, вы соглашаетесь с хранением и использованием порталом и партнёрскими сайтами файлов cookie и рекомендательных технологий на вашем устройстве. Подробнее