– Многоуважаемый Андо, выбирайте выражения. У меня нет с этим человеком абсолютно ничего общего, – скорчив недовольную физиономию, сказал Нэмото. Хотя в душе ему скорее нравились эти подшучивания. Чего уж тут плохого – быть похожим на Мияшту, которого все любят за добрый нрав и светлую голову и которому, к тому же, совсем скоро дадут место профессора?
– Не понимаю, почему каждый считает своим долгом сказать нам, что мы похожи? Нэмото, слышишь, я больше не намерен это терпеть. Придется тебе сесть на диету, – с этими словами Мияшта похлопал Нэмото по выступающему животику.
– Я согласен худеть, но только за компанию, – ответил тот.
– Ты совсем, что ли, ничего не соображаешь, Нэмото? Ну похудеем мы вдвоем, и что это изменит? – с этими словами Мияшта протянул Андо распечатку, давая понять, что шутки закончились.
Андо взял листки. Одного взгляда было достаточно, чтобы понять, что там изображено. Это были данные, снятые с секвенсора, через который пропустили молекулу ДНК.
Все живое на земле, включая вирусы, состоит из клеток, которые содержат в себе молекулы ДНК (иногда РНК). В ядре любой клетки находятся сложносоставные молекулярные вещества – так называемые нуклеиновые кислоты. Они бывают двух видов: дезоксирибонуклеиновая кислота (ДНК) и рибонуклеиновая кислота (РНК). У этих кислот разные функции. ДНК хранит в своих молекулах генную информацию. Молекула этой кислоты выглядит, как две спирально переплетенные нити – обычно это называется биспиралью. Именно там, внутри этой удвоенной спирали, и содержится вся генная информация того или иного биологического вида. Генная информация – это совокупность схем, по которым создаются специальные протеины. В этой совокупности каждый ген является отдельной схемой. Получается, что гены – это не ДНК, а так называемые минимальные элементы генной информации.
Так что же это за схемы? Что и как в них написано?
Схемы эти состоят из буквенных цепочек. Буквы приняты для обозначения четырех химических веществ, которые называются «нуклеотидами»: аденин (А), гуанин (G), цитозин (С) и тимин (Т), а в случае с РНК – урацил (U). Эти нуклеотиды в соответствии с определенными закономерностями объединяются в тройки (кодоны), которые кодируют ту или иную аминокислоту. Например, кодон ААС соответствует аспарагину, а кодон GCA – аланину.
Протеины являются соединениями, состоящими из молекул аминокислот. Молекул многие сотни, а самих кислот как минимум двадцать разновидностей. Получается, что протеин состоит обычно из нескольких сот, а иногда и тысяч нуклеотидов – в зависимости от того, сколько молекул входит в состав протеина. Причем количество нуклеотидов будет по крайней мере в три раза больше, чем количество аминокислот в данном протеине.
Таким образом, схему гена можно представить в виде буквенной цепочки: ТСТСТАТАС-CAGTTGGAAAATTAT... Эту цепочку можно разбить на тройки (кодоны) и получить описания, составляющих протеин аминокислот: ТСТ = серин (Ser), СТА = лейцин (Leu), TAG = тирозин (Tyr), CAG = глутамин (Gin), TTG = лейцин (Leu), GAA = глутаминовая кислота (Glu), AAT = аспарагин (Asn), TAT = тирозин (Tyr), и так далее [12] .
Андо еще раз взглянул на протянувшиеся через весь лист длинные цепочки, составленные из разнообразных сочетаний четырех букв: А, Т, G и С. В третьей по счету цепочке часть букв была выделена маркером.
– А это еще что такое? – тихо спросил Андо.
Вместо ответа Мияшта подмигнул Нэмото, словно говоря: «Давай объясняй!»
– Это анализ молекулы ДНК того вируса, который нашли в крови у Рюдзи Такаямы.
– Нашли у Рюдзи... ладно, и что же дальше?
– Понимаешь, только в этом вирусе оказалась такая последовательность нуклеотидов.
– И вы ее маркером отметили, как я понимаю.
– Да.
Андо внимательно вгляделся в выделенную цепочку:
ATG GAA GAA GAA TAT CGT ТАТ АТТ ССТ ССТ ССТ САА САА САА
Через пять строчек от этой была еще одна выделенная маркером группа букв. Андо, переводя взгляд со строчки на строчку, сравнивал выделенные отрезки.
Они были идентичны. На крошечном отрезке, где не было даже и тысячи нуклеотидов, обнаружились две абсолютно одинаковые последовательности.
Андо поднял глаза от распечатки взглянул на Нэмото.
– Где бы мы ее не резали – везде вылезает эта цепочка.
– А сколько их там?
– Кого, нуклеотидов?
– Ну да.
– Сорок два.
– Сорок два... Это значит четырнадцать троек. Не так уж и много.
Ниже приводится список используемых аббревиатур (всего 20 наименований):
Phe фенилаланин
His гистидин
Leu лейцин
Gin глутамин
Не изолейцин
Asn аспарагин
Met метионин
Lys лизин
Val валин
Ser Серин
Asp аспарагиновая кислота
Glu глутаминовая кислота
Pro пролин
Cys цистеин
Thr треонин
Thp триптофан
Ala аланин
Arg аргинин
Tyr тирозик
Gly глицин
* * *
Мияшта перебил его:
– Понимаешь, эта в целом ничего нам не говорящая комбинация была найдена только в крови у Такаямы. У двух других жертв ничего похожего мы не обнаружили. – Мияшта беспомощно взмахнул руками.
Что же получается? Это как если бы...
Андо задумался, подыскивая хороший пример. – Это как если бы у трех человек, один из которых Рюдзи Такаяма, нашли «Короля Лира» Шекспира – у каждого по книжке. Но при этом оказалось бы, что только в той книжке, которая находилась у Рюдзи, между строчек добавочно многократно вписан какой-то бессмысленный набор букв.
Сорок два нуклеотида, объединенных в аминокислотные тройки. Значит, если взять каждую аминокислоту за букву, получится всего лишь четырнадцать букв. И эта строчка из четырнадцати букв появляется то там, то здесь, через разные интервалы, но обязательно на каждой странице. И если знать, что эта книжка действительно «Король Лир», то можно без труда найти добавленные отрывки и отметить их ярким маркером.
– Так что ты по этому поводу думаешь? – было видно, что Мияште не терпится услышать ответ Андо. Как и полагается настоящему ученому, сталкиваясь с трудноразрешимой задачей, он каждый раз приходил в возбуждение.
– Что я думаю? С такими начальными условиями особо ничего не придумаешь.