и более раз. И если бы распределение было случайным, моно- и динуклеотиды преобладали бы. На практике применяют так называемый коэффициент сблоченности β — отношение суммы длинных блоков (4 нуклеотида и выше) к сумме коротких (три нуклеотида и ниже).
Мой коллега по лаборатории им. А. Н. Белозерского, А. Л. Мазин определил коэффициент β для ДНК разных организмов — от бактерий до млекопитающих. Получилась довольно четкая картина — в ряду от бактерий до человека β возрастает от 4 до 6 и выше. Сблоченность ДНК с усложнением организации неуклонно растет. А это значит, что снижается ее информационная емкость, как при возникновении корреляций между буквами в тексте. Генетический код становится все более и более неэкономичным. Возникает вопрос: почему это происходит?
Намек на ответ содержится в других работах А. Л. Мазина. Вспомним, что в большинстве известных нам случаев информационная РНК синтезируется только на одной из нитей или цепей ДНК, которую называют смысловой. Вторая, комплементарная нить — антисмысловая. Пуриновому блоку в смысловой цепи соответствует пиримидиновый в антисмысловой (и наоборот).
Исследования показали, что пиримидиновые, состоящие из Ц и Т, блоки имеют тенденцию скапливаться в смысловой цепи. Возникает асимметрия цепей ДНК. Значит, информационная РНК, на которой синтезируется белок, обогащается пуринами (А и Г). Конечно, она не может на 100% состоять из пуринов, ведь тогда в ней нельзя закодировать такие аминокислоты, как фенилаланин, серин, лейцин. Но тенденция явно имеется.
Для объяснения ее А. Л. Мазин вспомнил о старой моей работе с Л. М. Галимовой, в которой мы изучали синтез белков у тутового шелкопряда. Уже первые исследователи передачи генетической информации с гена на белок подметили, что этот процесс (трансляция) подвержен сильным помехам. Рибосомы могут считывать кодоны в матричной, информационной РНК неправильно, и в белок включаются не те аминокислоты. Этот процесс (
Мы кормили гусеницу шелкопряда листьями шелковицы, смоченными раствором стрептомицина в лошадиной концентрации. Гусеницы ели, линяли, исправно завивали коконы. А кокон состоит всего из двух белков — фиброина и серицина — клейкого вещества, склеивающего фиброиновые нити.
Серицин легко перевести в раствор кипячением — так мы без особых трудов получаем чистейший белок, без примеси других. Гидролизат его можно уже пустить в аминокислотный анализатор. Оказалось, что стрептомицин достоверно изменял состав белка: одних аминокислот становилось больше, других меньше[5]. Первые мы назвали плюс-, вторые минус-аминокислотами.
Оказалось, что эти категории не случайны. Плюс-аминокислоты в матричной (информационной) РНК кодируются в основном пуринами (А и Г), а минус — пиримидинами (Ц и У- уридином, неметилированным тимином, который заменяет Т в РНК). Пурины и пиримидины тоже неоднородны по точности считывания. С учетом литературных данных У в результате неверного прочтения мог быть прочтен рибосомой как Ц, Г, А; Ц — как Г и А; Г- как А, и лишь аденин обычно считывался правильно.
Естественно было связать повышенную помехоустойчивость с термодинамической устойчивостью символа. Последняя величина измеряется энергией резонанса — той энергией, которая потребна для изменения структуры вещества. В ряду У, Ц, Г, А эта величина соответственно 1.92, 2.22, 3.84, 3.89 (ккал/моль). Аденин наиболее устойчив, именно потому он легко полимеризуется в опытах (и, вероятно, на первозданной Земле) из цианистого водорода и потому входит в состав АТФ — универсального аккумулятора энергии в биологических системах.
А. Л. Мазин предположил, что в ходе эволюции вместе с усложнением структур шло параллельное повышение помехоустойчивости информационного канала ген-белок. А это означало обогащение мРНК пуринами (и смысловой цепи ДНК — пиримидинами). Отбор мутаций, следовательно, идет и на уровне гена — такой вывод он сделал, проанализировав на ЭВМ 64 белка — цитохрома С.
Справедлива ли эта гипотеза? Мне, конечно, приятно, что Александр Львович вспомнил через 17 лет о работе, которую я и сам за другими делами давно забыл. Но, увы, если это правда, то не вся правда. Вспомним, что у высших организмов белок кодирует лишь ничтожная доля ДНК — а тот же Мазин показал, что наиболее сблочены, наиболее отличаются от стохастических как раз те части генома, кои сейчас именуют лишними, ненужными и эгоистичными.
Могу лишь предположить, что помехоустойчивость этих текстов не менее, если не более важна для организма. Некодирующие белок последовательности также должны быть прочтены — на уровне ДНК или РНК — узнающими их структурами, скорее всего, регуляторными белками.
А в результате мы опять приходим к выводу об аналогии между лингвистической и генетической информациями. И в том и в другом случае помехоустойчивость каналов возрастает ценой снижения информационной значимости сигнала. Принцип одинаков, хотя в одном случае информацию считывает рибосома, а в другом — человеческая гортань. Гены просто сохранили больше следов своего случайного, стохастического возникновения.
На этом можно бы и кончить главу: определением гена, как стохастической, возникшей в результате случайного перебора последовательности, лишь в незначительной степени отредактированной отбором. Но мог ли ген того же глобина или цитохрома С возникнуть случайно? И мы приходим к новому «проклятому вопросу» современной биологии, который называется:
Парадокс миллиона обезьян. Вообще-то эта проблема отнюдь не нова. Философы еще в древности задавались вопросом: возможно ли возникновение достаточно сложной структуры, описываемой большим объемом информации, в результате случайных, стохастических процессов? И все давали отрицательный ответ. Еще Цицерон полагал, что из случайно брошенных знаков алфавита не могут сложиться «Анналы» Энния. Через полторы тысячи лет ему вторит Жан-Жак Руссо:
Теперь эту проблему называют «парадоксом миллиона обезьян». За сколько лет миллион обезьян, посаженных за пишущие машинки, напечатают полное собрание сочинений Шекспира, или хотя бы одного «Гамлета»?
«Обезьяний парадокс» переходит из одного философского трактата в другой. Странно, что никто не задался вопросом: может ли миллион людей, никогда о Шекспире не слыхавших, напечатать «Гамлета»? Отсюда недолго дойти до вопроса: а мог ли «Гамлета» написать сам Шекспир, если даже миллиону людей это не под силу? И применима ли вообще теория вероятности к этой категории явлений?
Как видите, начав с вопроса о корреляциях между знаками в нуклеотидных последовательностях, мы пришли к проблеме философской, если хотите, гносеологической, затрагивающей коренные тайны мироздания.
Еще в 1936 году Н. К. Кольцов писал, что вероятность случайного возникновения полипептида из 17 аминокислотных остатков (гептакайдекапептида) равна одной триллионной, и сделал из этого совершенно правильный вывод — гены синтезируются не заново, а матричным путем. Но как возникла первая матрица? Как говорила фонвизинская госпожа Простакова:
Хватает ли времени на возникновение первого гена — протогена — случайным путем, стохастическим перебором нуклеотидов? Напомню, что солнечная система, Солнце со всеми планетами, сформировалась по самым последним оценкам 4,6 млрд. лет назад (плюс-минус 0,1 млрд.). Первые следы жизни на Земле имеют возраст более 3,8 млрд. лет. Добавлю и то, что значительный срок наша планета явно не годилась для возникновения жизни.
Подобные соображения время от времени воскрешают гипотезу о внеземном, космическом происхождении жизни. Эта гипотеза (панспермии) была еще в прошлом веке выдвинута Сванте Аррениусом, и суть ее можно выразить так: в вечной и бесконечной Вселенной жизнь так же вечна и бесконечна. Споры, зародыши жизни, микроорганизмы могут покинуть родную планету и давлением света транспортироваться бог весть куда — от планеты к планете, от звезды к звезде. У нас к идее панспермии склонялся В.