Ответ на первый вопрос несложен: быстро. Очень быстро — в масштабах времени, прошедших с той поры, как он сформировался. Второй вопрос вызывает встречный: Каким'таким'? Ответ на него остается загадкой, ей посвящена оставшаяся часть книги, из которой Читатель, возможно, вынесет представление о неслучайности существующей версии. Третий вопрос возвращает нас к гипотезе Георгия Гамова, с которой фактически началась эра ДНК, то есть, молекулярная биология, и с которой мы начнем ответ на упомянутый встречный вопрос в следующей главе.
.....................
Число 11, вынесенное в заголовок этой главы, хотя и менее выразительное, нежели число 111, в определенном контексте также могло бы служить информационным символом. В конце концов, параллель между тремя единицами числа 111 и триплетностью генетического кода упирается в определенное ограничение последней, поскольку генетический код триплетен лишь по размеру кодона. Функциональную же нагрузку несут в кодоне, по преимуществу, только две первые буквы, а третья служит простым разграничителем в восьми случаях из двадцати или одним из двух вариантов такого разграничителя — еще в десяти. И только два кодона являются истинно триплетными — TGG (W), и ATG (М). Еще один триплет универсального кода со всеми тремя значащими буквами — TGA — является пунктуационным кодоном.
Номер этой главы — единственный в этой книжке — совпадает со своей позицией, помеченной (гораздо менее выразительным) римским числом.
Глава 496. Почему кодируемых аминокислот двадцать? (XII)
Неискушенному Читателю может показаться, что элементы машины генетического кодирования описаны в предыдущей главе настолько детально, что к концу чтения он стал даже как-то утомляться, чувствуя, что несколько заинтриговавшее его начало книжки оборачивается страницами из учебника для старших классов, способными привести в уныние любого, кто вспомнит родную школу. Искушенному же Читателю, напротив, все рассказанное хорошо известно, и он, грешным делом, подумывает, не написать ли самому учебник посвежее — для тех же старших классов. Не мысля гордый свет забавить — другими словами, не имея намерения вогнать в скуку того и другого, Автор хотел бы подчеркнуть, что понимает: дьявол скрывается в деталях. Но их так много в молекулярной биологии, что любая формализация кажется возмутительным упрощением. Однако, часто бывает, что соблазн формализации неодолим, и тут Автор не может отказать себе в удовольствии еще раз процитировать испанского философа Хосе Ортегу-и-Гассета: «Серый цвет аскетичен. Такова его символика в обыденном языке, на этот символ и намекает Гете: „Теория, мой друг, суха, но зеленеет жизни древо“. Самое большее, на что способен цвет, не желающий быть цветом, — стать серым; зато жизнь представляется зеленым деревом — какая экстравагантность!.. Элегантное желание предпочесть серый цвет чудесной и противоречивой цветовой экстравагантности жизни приводит нас к теоретизированию. В теории мы обмениваем реальность на тот ее аспект, каким являются понятия. Вместо того чтобы в ней жить, мы о ней размышляем. Но как знать, не скрывается ли за этим явным аскетизмом и удалением от жизни, каким является чистое мышление, наиболее полная форма жизненности, ее высшая роскошь? »
— Браво, Хосе! Именно так я и думаю — даже убежден в этом.
Формализации, теоретизированию, схемам, дизайну генетического кода посвящена основная, хотя и меньшая по объему, оставшаяся часть книги, к которой Автор сейчас переходит. Первая формальная гипотеза структуры генетического кода представляет собой возможный ответ на вопрос, почему кодируемых аминокислот именно двадцать.
В 1954 году Гамов первым показал, что 'при сочетании 4 нуклеотидов тройками получаются 64 комбинации, чего вполне достаточно для записи наследственной информации«.Он был первым, кто предположил кодирование аминокислот триплетами нуклеотидов и выразил надежду, что «кто-нибудь из более молодых учёных доживёт до его [генетического кода] расшифровки». В 1968 году американцы Роберт Холли, ХарКорана и Маршалл Ниренберг получили Нобелевскую премию за расшифровку генетического кода. Премия была присуждена уже после смерти Георгия Гамова в том же году четырьмя месяцами ранее.
Числа 64 (теоретическая емкость кода) и 20 (фактическая кодирующая емкость, то есть количество кодируемых аминокислот) составляют соотношениеправил комбинаторики для размещений и сочетаний с повторами: число А размещений (упорядоченных наборов) с повторами из r (r = 3; размер кодона) элементов множества М, содержащего k (k = 4; число оснований) элементов, равно
Akr = kr= A43 = 64,
а число С сочетаний с повторами из k элементов по r, т.е. любое подмножество из 3 элементов множества, содержащего 4 элемента, равно:
Сkr= [(k+r-1)!] : [r! (k-1)!] = С43 = 20.
Это немедленно подводит к мысли о том, что эволюция генетического кода могла начаться с этапа «наборного» кодирования, когда продукт кодировался не последовательностью оснований триплета, а их набором, то есть две такие группы кодонов, как например, САА, АСА, ААС или TGC, TCG, GCT, GTC, CTG, CGT были функционально равнозначны (внутри группы) и направляли синтез одной и той же аминокислоты каждый. Подобные соображения приходят в голову при чтении работ Ишигами и Нагано (1975) — с их идеей о том, что каждая первичная аминокислота могла соответствовать широкому набору кодонов, а также Фолсома (1977) и Трейнора (1984) — с их идеей пермутации оснований в рамках триплета. Очевидно, что меньшее число кодонов не обеспечивало необходимого разнообразия продуктов, а большее было избыточно и, по крайней мере, не соответствовало числу известных сегодня аминокислот. В свое время мы также внесли (очень) скромную лепту в эти идеи, отметив, что число сочетаний из 4 по 3 с повторами иллюстрируется числом квантовых состояний Бозе-газа из трех частиц с четырьмя вероятными собственными квантовыми состояниями[54].
Позднее Гамов предложил схему реализации генетического кода, которая предусматривала сборку полипептида непосредственно на молекуле ДНК. По этой модели, каждая аминокислота помещается в ромбической выемке между четырьмя нуклеотидами, по два от каждой из комплементарных цепей. Хотя такой ромб состоит из четырёх нуклеотидов и, следовательно, число сочетаний равно 256, из-за ограничений, связанных с водородными связями нуклеотидных остатков, возможными оказываются как раз 20 вариантов таких ромбов. Эта схема, получившая название бубнового кода, предполагает корреляцию между последовательными аминокислотными остатками, так как два нуклеотида всегда входят в два соседних ромба (перекрывающийся код). Дальнейшие исследования показали, однако, что эта модель Гамова также не согласуется с опытными данными.
Если бы емкость генетического кода использовалась без остатка, то есть каждому триплету соответствовала бы только одна аминокислота, его защищенность была бы весьма сомнительна: любая нуклеотидная мутация могла оказаться катастрофической. В случае же действующей версии треть случайных точечных мутаций приходится на последние буквы кодонов, половина которых (кодоны октета I) к мутациям не чувствительна вовсе: третья буква кодона может быть любой из четырех — T, C, A или G. Устойчивость к точечным мутациям кодонов октета II в значительной степени определяется двумя факторами — (1) возможностью произвольной замены третьего основания (правда, уже при выборе только из двух — либо пуринов, либо пиримидинов), не меняющей кодируемой аминокислоты вовсе, и (2) возможностью замены пуринов на пиримидины и наоборот, которая сохраняет близкую гидрофильность/гидрофобность продуктов, хотя и не сохраняет их массы. Таким