сделать.

Как же геном кодирует белки?

Начнем с того, что любой белок — это цепочка аминокислот. Причем всегда линейная, то есть неветвящаяся. Именно здесь это становится очень важно. Порядок аминокислот в цепочке называется первичной структурой белка (см. главу 3). Все остальные уровни структуры — вторичная, третичная и четвертичная — относятся уже к сворачиванию аминокислотной цепи в объеме, в трехмерном пространстве.

И вот тут возникает важнейший факт, который вообще-то относится к физической химии, но — внезапно — оказывается ключевым для понимания такой тонкой материи, как наследственность. Факт этот следующий. Первичная структура белка (то есть аминокислотная последовательность), как правило, однозначно определяет все остальные уровни его структуры, то есть всю укладку молекулы в объеме. Именно поэтому простая линейная последовательность нуклеотидов — иначе говоря, нуклеотидный текст — может полностью определить все свойства любой сколь угодно сложной белковой молекулы. Ведь первичная структура такой молекулы тоже линейна, и ее тоже можно считать текстом. Только вот «буквы» в этих текстах разные.

И перед нами немедленно возникает следующий вопрос: каким образом нуклеотидный «алфавит» переводится в аминокислотный?

Генетический код

Пока большинство биологов считало гены белками, все было относительно просто. Белок, как мы знаем, представляет собой линейную цепочку аминокислот, которые могут чередоваться в любом порядке. Двадцать аминокислот — это количество, вполне сравнимое с количеством букв в каком-нибудь древнем алфавите, вроде греческого или финикийского. Такая система кодирования позволяет хранить любую информацию не хуже, чем в обычной книге. Получается, что «белок является как бы длинным предложением, записанным с помощью двадцати букв»[63].

Правда, надо тут же заметить, что до открытия великой двойной спирали практически никто из биологов в таких понятиях не рассуждал. Перейти с привычного «аналогового» языка традиционной биологии на «цифровой» язык новой биологии, изучающей информационные процессы, им и в дальнейшем было непросто. Многим даже очень крупным ученым, профессионально сложившимся до 1953 года, это вообще так никогда и не удалось. Идея цифровой записи наследственной информации вживалась в биологию с удивительным трудом, несмотря на то что со времен работ Менделя к тому времени прошло уже почти 100 лет. Впору предположить, что эта идея противоречила какой-то фундаментальной особенности склада ума большинства людей, выбиравших биологию своей профессией.

Так или иначе после открытия генетической роли ДНК все заметно усложнилось. Стало понятно, что «базой данных», хранящей последовательности белков, служит не какой-то особый белок, специально приспособленный для записи информации (как это вполне можно было бы вообразить), а совершенно другой полимер, резко отличающийся от белка химически и к тому же содержащий всего-навсего четыре типа мономеров вместо 20. Так возникла проблема перекодировки, или, в более привычных нам терминах, проблема генетического кода.

Тут обязательно нужно пояснение. В сети и публицистике довольно часто встречается мнение, будто генетический код — примерно то же самое, что и генетическая информация. Так вот, это совершенно неправильно. Код — это не сама информация, а словарь, с помощью которого ее можно прочитать. Или более строго: генетический код — это способ перевода друг в друга текстов, записанных с помощью двух разных алфавитов — нуклеотидного и аминокислотного. Своего рода шифровальный ключ. Последнее — даже не метафора: первые теоретики, писавшие о генетическом коде, сразу предложили использовать для его расшифровки математический аппарат криптографии, благо эта наука после Второй мировой войны была развита отлично.

Итак, чего стоит ожидать от генетического кода? У тех ученых, которые сразу после открытия двойной спирали ДНК первыми занялись этим вопросом, получилось примерно следующее:

• аминокислот в составе белков 20, а разновидностей нуклеотидов в ДНК всего четыре. Значит, каждая аминокислота должна кодироваться не одним нуклеотидом, а неким их сочетанием. Примерно так, например, вводятся с помощью клавиш китайские и японские иероглифы;

• отличающихся друг от друга двоек нуклеотидов (дублетов) может существовать максимум 16. Для кодирования всех аминокислот этого не хватит. Значит, генетический код должен быть как минимум триплетным[64];

• отличающихся друг от друга троек нуклеотидов (триплетов) может существовать максимум 64. То есть их намного больше, чем аминокислот. Значит, каждая аминокислота, скорее всего, кодируется не одним триплетом, а несколькими разными. Таким образом, надо ожидать, что генетический код — избыточный (иногда это называют заимствованным из квантовой физики термином «вырожденный»).

Человека, который первым опубликовал эти соображения, звали Георгий Антонович Гамов. Это был крупный физик-теоретик, причастный к созданию теории Большого взрыва. Занятия биологией для него были эпизодом, но очень плодотворным. Гамов вычислил «на кончике пера» основные параметры генетического кода, и вскоре эксперименты показали, что предсказал он их в основном правильно.

Почти одновременно с Гамовым и, похоже, даже немного раньше очень сходные выкладки совершенно независимо подготовил другой ученый — молодой советский эмбриолог Александр Александрович Нейфах. Но его статью не приняли к публикации! «Редакция „Известий Академии наук. Серия биологическая“ отклонила статью, сославшись на то, что формальные математические соображения неприменимы к такой самобытной науке, как биология»[65]. Эта история как нельзя лучше показывает, насколько трудно было подавляющему большинству биологов переключиться с «аналогового» мышления на «цифровое». А Нейфах в результате остался без приоритета, и вся советская наука вместе с ним. После Гамова публиковать статью с теми же расчетами было уже бессмысленно.

«Самым трудным в проблеме кода было понять, что код существует, — писал соавтор Гамова Мартинас Ичас. — На это потребовалось целое столетие. Когда это поняли, то для того, чтобы разобраться в деталях, хватило каких-нибудь десяти лет».

Полный генетический код выглядит достаточно просто. Это таблица из 64 ячеек, в каждой из которых значится определенная тройка нуклеотидов (вернее, азотистых оснований, входящих в их состав, — ведь все остальные части в нуклеотидах, составляющих ДНК, одинаковы). Эти тройки называются кодонами. Генетический код состоит из 61 кодона, кодирующего аминокислоты, и трех стоп-кодонов, на которых синтез белковой цепи останавливается. Есть всего две аминокислоты, кодирование которых не является избыточным, то есть подчиняется правилу «одна аминокислота — один кодон». Это метионин и триптофан. Любая другая аминокислота кодируется как минимум двумя разными кодонами. Многие аминокислоты кодируются четырьмя кодонами, а некоторые даже шестью.

Кодоны, кодирующие одну и ту же аминокислоту, называются синонимичными. Например, кодон ТТТ (три тимина подряд) кодирует аминокислоту фенилаланин, и кодон ТТЦ (тимин-тимин-цитозин) — тоже. Довольно часто (но не всегда!) бывает, что синонимичные кодоны отличаются друг от друга только последней «буквой», как мы это в случае с фенилаланином и видим.

Вместо тимина (Т) в таблице генетического кода можно везде поставить урацил (У) и наоборот (см. рис. 9.1). Эти два азотистых основания в данном контексте взаимозаменяемы. Дело в

Добавить отзыв
ВСЕ ОТЗЫВЫ О КНИГЕ В ИЗБРАННОЕ

0

Вы можете отметить интересные вам фрагменты текста, которые будут доступны по уникальной ссылке в адресной строке браузера.

Отметить Добавить цитату