Объем рынка, связанного с массовым секвенированием, будет огромным. Даже просто умножив заветную «тысячу за геном» на сколь-нибудь заметный процент от трехсотмиллионного населения только одних США, получим десятки миллиардов долларов как грубую оценку минимального объема денег, которые будут вовлечены в эту экономику. Учтем, что развитие персонального секвенирования приведет к возникновению новых индустрий, в первую очередь - конструирования и производства лекарств, адаптированных к индивидуальным генетическим параметрам. Не говоря уж о тех индустриях, которые придется создать для того, чтобы быстрое и дешевое секвенирование стало возможным. Ну а интерпретация результатов секвенирования (см. комментарий Александра Чубенко), без которой все эти усилия теряют смысл, потребует развития не только биологических наук о функциях и взаимосвязях генов и белков, но и серьезных биоинформационных достижений. Но даже сегодня, когда этих индустрий еще не существует, рынок секвенирующих машин и химикатов для них оценивается почти в миллиард долларов в год, при этом прогнозируется ежегодный рост в 4-5%.
Параллельно с частными компаниями серьезные средства в ускоренное секвенирование вкладывает госсектор. Одновременно с объявлением конкурса X Prize американский Национальный институт исследования генома человека (National Human Genome Research Institute, NHGRI) сообщил о результатах очередного конкурса на получение грантов общей суммой 13 млн. долларов для работы над этой проблемой. В этом году гранты получили девять ученых, работающих над снижением стоимости исследования до тысячи долларов - в далекой перспективе, и двое, стремящихся довести ее до ста тысяч, но гораздо раньше. Сто тысяч за геном - та сумма, которая позволит использовать полное секвенирование сотен индивидуальных геномов в изучении генетически обусловленных заболеваний.

Как считает Джордж Черч (George Church), стотысячный рубеж будет пройден не позже 2009 года, а очень вероятно, что и раньше. Тысячный рубеж, по планам NHGRI, намечен ориентировочно на 2014 год, но по мнению Черча, в этом вопросе ясности гораздо меньше. Неясно даже, нужно ли доводить стоимость именно до тысячи долларов, а главное - нужно ли определять последовательность нуклеотидов полностью, ведь интересен лишь один процент из них. Выяснить, какие именно участки генома составляют этот процент - вполне реалистичная задача с точки зрения Черча, и если сконцентрироваться на ней, можно достичь желаемого результата (массового секвенирования) раньше.
Об этом Черч говорил в сентябре на конференции Emerging Technologies 2006 в МТИ (см. о ней колонку Левона Амдиляна в «КТ» #659). Однако похоже, что индустрия в целом сконцентрирована на проблеме ускорения/удешевления как таковой - точно так же, как разработчики суперкомпьютеров соревнуются по количеству терафлопсов, а не по новым методам решения задач. В сообщениях о платформах следующего поколения для секвенирования чаще всего мелькают названия компаний Applied Biosystems, Solexa, 454 Life Sciences. Здесь мы не будем вдаваться в описание достоинств и проблем различных технологий (см., например, материал Сергея Борисова в «КТ» #603, а также подборку популярных материалов на www.cbio.ru). Отметим лишь одну новую и очень наглядную идею, которая обещает рекордную производительность: метод нанопор. Молекула ДНК протаскивается через отверстие нанометровых размеров в мембране (см. рис.). Каждый нуклеотид, попадая в отверстие, изменяет электропроводность мембраны, причем на разную величину в зависимости от типа нуклеотида - что и позволяет (в принципе) конвертировать изменения чудовищно слабого электрического сигнала прямо в «буквы» кода. При этом не надо, как в других методах, дробить молекулу ДНК на маленькие фрагменты, а потом многократно дублировать и сопоставлять результаты их обработки. Если удастся преодолеть многочисленные проблемы и добиться расшифровки генома таким методом со скоростью 10 тысяч нуклеотидов в секунду, то небольшой твердотельный массив нанопор обеспечит секвенирование генома человека за 20 часов - по крайней мере, так обещает группа Джина Головченко (Jene Golovchenko), физика из Гарварда, реализующая один из вариантов этой идеи (любопытно, что среди многочисленных авторов других вариантов есть и сам Джордж Черч, уже сотрудничающий на этой почве с мощной компанией из мира полупроводниковых технологий Agilent Technologies, которая, не мелочась, оценивает потенциальную скорость такого секвенирования в миллион пар нуклеотидов в секунду - примерно по геному в час).

Задача получить за 1000 долларов полную информацию о последовательности нуклеотидов в человеческом геноме выглядит вполне реальной. Немного смущает срок в 5-10 лет (X Prize взяла его не с потолка, а со слов самых авторитетных разработчиков быстрых методов секвенирования, но их оптимизм может оказаться немного преувеличенным). Однако рубеж в тысячу у. е. - это только промежуточный финиш. Самое интересное начнется после: полученную информацию надо будет интерпретировать.
Для начала текст можно сразу сократить на порядок, вычеркнув накопившуюся за миллиарды лет явно бессмысленную информацию. Внутри генов можно исключить из рассмотрения интроны - участки, которые вырезаются после синтеза матричной РНК. Зато придется учесть, что некоторые гены разбросаны по хромосомам, другие кодируют сразу несколько белков и т. д. - в общем, до начала анализа надо будет свести объем информации к осмысленным «словам». Большинство из этих примерно 30000 генов (вернее, пар генов) придется исключить из рассмотрения: идентифицировать функции каждого из закодированных в генах белков - задача куда более сложная, чем разработать метод дешевого секвенирования генома, а протеомика - очень молодая наука.
Выявление фенотипических проявлений генного полиморфизма (вариантов структуры генов, существенных для функций их белков) - следующий этап на пути к практическому применению информации об индивидуальном геноме. Обратите внимание: для анализа персонального генома надо исследовать не одну, а обе хромосомы в каждой из 23 пар - поэтому в условиях конкурса и указаны не три, а шесть миллиардов пар нуклеотидов. Даже такие простые признаки, как цвет кожи или глаз, определяются несколькими парами генов.
Организм состоит из сотен типов клеток, и в каждом из них активна только часть генов - и активна по- разному, в зависимости от множества внешних и внутренних факторов. Вспомните школьный учебник биологии с рисунками двух овечек одной породы (у той, которая выросла в холодном климате, шерсть заметно гуще и длиннее) и представьте, сколько сотен разных белков у них функционируют по-разному.
Белки регулируют активность друг друга (а также - своих и чужих генов) множеством прямых и обратных связей, а метаболомика, которая изучает эти связи и их механизмы, - еще более молодая наука, чем протеомика. Только между мужчинами и женщинами в одном из недавних исследований выявили около двух тысяч различий в функциях одних и тех же белков! И это между «мужчинами вообще» и «женщинами в целом».
Уже сейчас достаточно точно известна роль тысяч генов, определяющих неизбежные наследственные болезни или повышение вероятности многих наследственно обусловленных заболеваний (а к ним, по осторожным оценкам, относится не меньше половины человеческих болячек). А главное - в общих чертах известно, что, где и как искать. Фармакогеномика сейчас делает самые первые шаги - не столько из-за неполноты знаний, сколько из-за высокой стоимости анализа индивидуальных и даже расовых различий в работе ферментов. Когда расшифровка генома станет процедурой, доступной рядовым гражданам не слишком бедных стран, по такому анализу можно будет получить прогноз индивидуальной предрасположенности к заболеваниям - а кто предупрежден, тот вооружен. И для лечения болезней можно будет назначать наиболее подходящие конкретному больному препараты в оптимальной дозировке.
Тысяча долларов - это не просто круглая цифра. Давно подсчитано, что производство лекарств и оказание медицинских услуг становятся рентабельными, если они доступны хотя бы каждому третьему из нуждающихся в них. Реальная стоимость «генетического паспорта» будет больше - ведь полученные данные необходимо проанализировать и разработать на их основе индивидуальные рекомендации. Но ожидаемая