можем быть уверенными, что ДНК есть некий вид проекта или рецепта наших белков. Это подтверждено экспериментально, поскольку изменения ДНК влекут изменения белков. Чаще всего такие изменения приводят к плохому функционированию белков, которое мы называем болезнью. Но иногда они благоприятны, и в этом случае болезнь получает повышение до статуса эволюции.
Как мы уже упоминали, белки представляют собой нити маленьких молекул, называемых «аминокислотами» и имеющих базовую структуру, показанную на рис. 2.10. Более формально мы говорим, что белок есть
Рис. 2.10. Белок строится из аминокислот, каждая из которых имеет структуру, изображенную слева на этой иллюстрации. Серый эллипс различен для разных случаев, но все аминокислоты, фигурирующие в биологии, имеют общую схему. Когда две аминокислоты связываются вместе, атом углерода в группе -COOH (в правой части молекулы) прикрепляется к атому азота (в левой части молекулы). Множество аминокислот соединяются вместе так, чтобы образовать длинную цепь, как показывает структура справа. Вообще такая цепь называется
Поскольку молекула ДНК состоит из последовательности нуклеотидов A, C, G и T, естественно предположить, что они являются «буквами», из которых комбинируются «слова»,
Взломщики кодов все же исследовали тупиковые пути, иногда с большой элегантностью, но делали это в манере Аристотеля, сидя в кресле. Эксперимент вмешался снова и показал, что Природа не принимает наиболее элегантные, экономные схемы, которые выбрали бы люди, если бы власть была у них. Генетический код казался кодом, о котором взломщики кодов всегда мечтали, поскольку символов было так мало (четыре), а зашифрован был не приказ о наступлении, а всего лишь одна из приблизительно двадцати возможностей. В то время, в 1953 г., данных почти не было, ибо никто не знал ни одной нуклеотидной последовательности ДНК, а известные последовательности аминокислот в белках были известны весьма приблизительно: Фредерик Сэнгер (р. 1918) был близок к завершению своей дешифровки белка инсулина (которую он закончил в 1955 г.), но это было почти все. Открылось множество возможностей для неограниченного воображения.
Русский физик Георгий Гамов (1904-1968) бесспорно обладал неограниченным воображением, поскольку он инициировал теорию происхождения Вселенной в результате Большого Взрыва и придумал теорию происхождения элементарных частиц. Он интересовался всем, и вполне естественно, что его внимание привлекла самая животрепещущая проблема 50-х, генетический код. Гамов выдвинул блистательную идею: белки растут на внешней стороне двойной спирали в ромбоидальных полостях, расположенных в желобках спирали. Эти полости образованы четырьмя нуклеотидными основаниями, два из одной нити, на вершине и на дне ромба, а в двух других углах основание из той же нити и его партнер из другой. Это остроумное решение дает триплетный код, даже несмотря на то, что в него входят четыре нуклеотида, потому что два последних (пара комплементарных оснований, например, А…T) считаются за одну букву (ведь если одним основанием является А, то другим непременно будет T). Затем он представил себе, что аминокислоты располагаются в соответствующих им нишах, а пробегающие мимо ферменты скрепляют их вместе. Далее он предположил, что ромбы, связанные закручиванием горизонтально или вертикально, кодируют одну и ту же аминокислоту, и в результате остается только двадцать различных кодонов, как раз то число, которое, как он полагал, было необходимо. Изобретательность, однако, в этом случае заставила сделать ложный шаг, здесь не хватало избыточности и не было места для кодонов запуска и остановки. С оптимизмом, который порождается энтузиазмом, с оптимизмом, произошедшим из энтузиазма, Гамов думал, что он, видимо, нашел путь к решению проблемы.
Ромбический код Гамова обладает еще одним особым свойством: он является перекрывающимся кодом, в том смысле, что каждое нуклеотидное основание входит одновременно в три кодона. Так, последовательность AGTCTTG состоит из кодонов AGTCTTG, AGTCTTG, AGTCTTG, AGTCTTG и AGTCTTG. Перекрывающийся код очень эффективен и компактен, что, казалось бы, делает его для Природы привлекательным кандидатом на занятие должности. У Природы, однако, были иные идеи. Одна из проблем, создаваемых перекрывающимся кодом, состоит в том, что многие аминокислотные последовательности оказываются вне игры. Например, предположим, что мы хотим закодировать дипептид, очень маленький белок, состоящий из двух аминокислот. Его образцом является заменитель сахара аспартам, комбинация слегка модифицированных форм двух аминокислот, аспарагиновой кислоты и фенилаланина. Поскольку существуют двадцать естественно образующихся аминокислот, существует 20×20=400 возможных дипептидов. Чтобы закодировать две аминокислоты перекрывающимся кодом, необходимы четыре основания, например, CCGA, чтобы получить CCGA для аминокислоты пролина (которую означает данный триплет) и CCGA для аргинина. Но существует всего 4×4×4×4=256 возможных комбинаций из четырех нуклеотидных оснований, поэтому