И в заключение рассмотрим важный вопрос: достаточно ли в клетке ДНК для кодирования всех структур сложного фенотипа?
По этому поводу еще недавно велись дискуссии. Казалось, что ДНК явно не хватает. Однако попробуем определить объем генетической информации, как это делал Джон фон Нейман, в битах. Вспомним слова великого физика лорда Кельвина: «Если Вы можете измерить то, о чем говорите, и выразить это в числах, то Вы что-то знаете об этом предмете; если же Вы не в состоянии ни измерить, ни выразить это в числах, то Ваши знания предмета скудны и неудовлетворительны».
Вот схема простенького расчета, когда-то мною проделанного. Если бы все основания в ДНК встречались в одинаковом количестве, вероятность встречи каждого из них была бы 0,25.
Отсюда информационная ценность каждого из оснований
Однако ДНК в геноме неоднородна по составу. Для высших организмов, например позвоночных животных, доля пары гуанин – цитозин составляет всего около 40 процентов. Кроме того, в ней имеются фракции, обогащенные парами АТ и ГЦ. У некоторых крабов в хромосомах выявлены последовательности состоящие только из двух оснований А и Т. Информационная ценность нуклеотидного звена в них снижается вдвое:
то есть основание может быть только или аденином или же тимином.
Оценить неоднородность ДНК в геноме можно простым опытом. Если мы будем повышать температуру раствора ДНК, то на каком-то уровне средняя кинетическая энергия молекул окажется выше энергии водородных связей, которыми скреплены половинки двойной спирали. Температура, при которой распадается (денатурирует) половина молекул ДНК, называется температурой плавления. Она сильно зависит от концентрации катионов в растворе (примерно прямо пропорциональна логарифму их концентрации). В паре ГЦ три водородные связи, в паре АТ только две. Поэтому чем больше ГЦ в ДНК, тем более она «тугоплавка». Отсюда следует, что по ширине интервала температур, в котором ДНК плавится, можно судить о ее неоднородности (гетерогенности) в геноме.
Расчет дал около 1,9 бита на основание даже для гетерогенной ДНК млекопитающего (теленка). А число нуклеотидов в геноме млекопитающего около двух-трех миллиардов (у человека два миллиарда, а у буйвола на 40 процентов больше; видно, дело не в количестве). Значит, запас информации в ДНК млекопитающего 4—6 миллиардов бит, что соответствует библиотеке в полторы-две тысячи томов.
Не забудьте, что этот запас содержится в яйцеклетке или головке спермия, имеющей микронные размеры. Какова свертка информации! Сказочный джинн, вылетая из бутылки, вырастает всего-навсего выше финиковой пальмы. Насколько действительность фантастичнее волшебной сказки!
Достаточно ли такого массива информации для постройки фенотипа? Задавшись таким вопросом, ученые спохватились: ведь мы же не умеем оценить сложность фенотипа количественно. В принципе любую структуру, в том числе структуру организма, можно описать с весьма высокой точностью (предел здесь накладывает так называемая квантовомеханическая неопределенность, о которой у нас речь пойдет в следующей главе). Представим, что мы разрежем организм на серию последовательных идущих друг за другом срезов. Расположение структур на каждом из срезов можно описать в двумерной системе координат и выразить объем этой информации в битах. Детальность описания зависит от толщины среза.
Допустим, толщина среза у нас будет один ангстрем (10-10м) – это величина, близкая к пределу разрешающей способности лучших современных электронных микроскопов. Но тогда, скажем, для описания фенотипа человека ростом в 180 сантиметров придется сделать и описать 18 миллиардов таких срезов!
Ясно, что таких опытов никто не проделывал. Все подобные эксперименты оставались мысленными. Структуру поменьше и с меньшим уровнем разрешения, например бактериальную клетку или митохондрию, так описать можно. Увеличивая толщину срезов, скажем, в сто или тысячу раз, мы можем дать описания, но в сто или тысячу раз менее детальные.
А величинам, полученным в результате мысленных экспериментов и приближенных расчетов, как-то не хочется верить. Все это попросту среднепотолочные цифры. Фенотипическую информацию организма человека оценивали и в 105и в 1025бит. Та же величина для бактерии, по данным разных авторов, колеблется от 104до 1012бит!
Но в теории информации существует правило (закон Шеннона): при передаче по любому каналу информация может только теряться за счет помех, но не увеличиваться. Значит, информация, потребная для описания структуры «человек», не должна превышать четырех миллиардов бит.
Вернее, она должна быть существенно меньше. Если в канале информации есть помехи (а они есть в любом канале), информация генотипа должна быть избыточной, многократно повторяться, иметь механизмы коррекции, устранения помех. Впервые я это очень наглядно понял, слушая переговоры по радиотелефону двух судовых радистов: «Аметист, Аметист, я 4347, я 4347, как меня слышите, прием, прием» – «4347, 4347, я Аметист, слышу вас хорошо, слышу вас хорошо, прием, прием».
Ответ не совсем точен: слышали мы хорошо, но из-за треска в динамике понимали плохо.
Примерно так обстоит дело и в канале информации «от ДНК к признакам организма»: не будь генетическая информация высокоизбыточной, новое поколение из-за случайных помех в развитии не походило бы на родителей, получался бы «не мышонок, не лягушка, а неведома зверюшка».
Но мы-то знаем, как удивительно точно черты родителей проявляются в потомстве. Еще более разительный пример точности передачи генетической информации – однояйцевые близнецы, братья и сестры, развившиеся из одной разделившейся яйцеклетки. У них идентичные наборы генов, поэтому только у близнецов удаются пересадки тканей и органов, их путают даже хорошие знакомые и не могут различить по запаху собаки.