теги, описывающие его цену, наличие, производителя, а также совместимость с другими продуктами.
Этот новый язык, как считают инженеры по программному обеспечению, сделает возможной гораздо более умную «беседу» между компьютерами в интернете. Он превратит Всемирную паутину информации во Всемирную паутину смысла – так называемую семантическую паутину. Разработчик языка HTML Тим Бернерс-Ли – инициатор развития альтернативного языка. В 2006 году в своей речи перед участниками Международной конференции World Wide Web в Шотландии он сказал, что «Всемирной паутине еще только предстоит пережить революцию» и что «через двадцать лет мы оглянемся назад и скажем, что это был только период ее зарождения». Он предвидит день, когда «механизмы торговли, бюрократии и нашей повседневной жизни будут находиться в ведении машин, общающихся с машинами».
В Центре имени Тьюринга Вашингтонского университета, являющемся ведущей лабораторией искусственного интеллекта, исследователи уже создали программное обеспечение, которое может на самом базовом уровне «читать» предложения на веб-страницах и извлекать из них смысл, не требуя от программистов никаких тегов. Эта программа под названием TextRunner сканирует предложения и определяет отношения между словами или фразами. Например, читая предложение «Торо написал “Уолден”, покинув свой домик в лесу», программа TextRunner понимает, что глагол «написал» описывает отношение между словами «Торо» и «Уолден». По мере сканирования большого количества страниц, содержащих сотни или тысячи подобных конструкций, программа может предположить, что Торо – это писатель, а «Уолден» – книга. Поскольку программа TextRunner читает с невероятной скоростью – при проведении одного из тестов она извлекла миллиард текстовых отношений из 90 миллионов веб-страниц, – она учится очень быстро. Разработчики программы рассматривают ее в качестве перспективного прототипа программы «машинного чтения», которое они определяют как «автоматическое, неконтролируемое понимание текста» компьютерами.
Ученые также обучают машины видеть. Компания Google работает с исследователями из Калифорнийского университета в Сан-Диего над усовершенствованием системы обучения компьютеров интерпретации фотографий и других изображений. Данная система сочетает текстовые теги, описывающие содержимое изображения, с его статистическим анализом. Сначала компьютер учится распознавать объект, например дерево, «просматривая» множество изображений, содержащих объекты, отмеченные людьми как «дерево». Компьютер учится устанавливать связь между тегом и результатом математического анализа форм, присутствующих в изображениях. В сущности, он учится определять дерево вне зависимости от его положения на изображении. Используя сначала человеческий интеллект, компьютер может в дальнейшем интерпретировать изображение самостоятельно, устанавливая собственные теги со все возрастающей точностью. В конце концов, он научится так хорошо «видеть», что сможет обойтись без учителей. Он начнет думать сам за себя.
В 1945 году физик из Принстонского университета Джон фон Нейман [54] набросал первый проект создания электронного компьютера, который может хранить в своей памяти инструкции по работе с ним. Его план лег в основу всех современных цифровых компьютеров. Революционная машина фон Неймана сразу же нашла применение у военных для проектирования ядерных бомб и другого оружия, однако ученый с самого начала понимал, что создал технологию общего назначения, способы использования которой невозможно предсказать полностью. «Я уверен, что это устройство, а точнее, виды устройств, первым представителем которых оно является, настолько новы, что многие из их применений станут очевидны только после того, как будут введены в эксплуатацию», – писал он 24 октября 1945 года Льюису Штраусу, будущему председателю Комиссии по атомной энергии. «Наиболее важные сферы применения, по определению, те, которые мы не осознаём в настоящее время, поскольку они далеки от нашей нынешней сферы».
Сегодня мы находимся на аналогичном этапе развития Всемирного компьютера. Мы построили его и начинаем его программировать, но мы далеки от осознания всех способов его использования. Однако мы можем ожидать, что, в отличие от машины фон Неймана, Всемирный компьютер не просто будет следовать нашим инструкциям. Он будет учиться у нас и в конце концов начнет писать собственные инструкции.
Джордж Дайсон – историк, изучающий развитие технологии, сын известного физика из Принстонского университета Фримена Дайсона – был приглашен в штаб-квартиру компании Google в городе Маунтин-Вью, Калифорния, в октябре 2005 года, чтобы выступить на вечеринке по случаю 60-й годовщины изобретения фон Неймана. «Несмотря на причудливую мебель и другие игрушки, – вспоминал Дайсон о своем визите, – мне казалось, что я находился в соборе XIV века, но только не в XIV веке, а в XII, во время его построения. Тут и там каждый был занят резьбой по камню, а невидимый архитектор сводил все в единое целое. Настроение было игривое, и все же в воздухе ощущалось благоговение». После своей речи Дайсон разговорился с инженером Google о неоднозначном плане компании по сканированию содержимого библиотек мира в ее базу данных. «Мы не сканируем эти книги для того, чтобы их читали люди, – сказал ему инженер. – Мы сканируем их для искусственного интеллекта».
Это посещение вдохновило Дайсона на написание эссе для онлайнжурнала Edge, где он утверждает, что мы достигли поворотной точки в истории вычислительных технологий. Сегодняшний компьютер – компьютер фон Неймана – в качестве памяти использует физическую матрицу. Каждый бит данных хранится в определенном месте этой матрицы, обладает уникальным адресом, а программное обеспечение состоит из набора инструкций для нахождения битов данных по указанным адресам и произведения над ними каких-либо действий. Этот процесс, по Дайсону, «можно представить как «СДЕЛАЙ ТО-ТО с тем, что находится ЗДЕСЬ, и помести результат СЮДА». Все зависит не только от точных инструкций, но и от точного определения параметров ЗДЕСЬ, ТАМ и КОГДА.
Как мы знаем сегодня и как предвидел фон Нейман в 1945 году, эта машина может быть запрограммирована на решение невероятного множества задач. Однако у нее есть фундаментальное ограничение: она делает только то, что ей прикажут. Она полностью зависит от указаний программиста и, следовательно, выполняет только те задачи, которые представляет себе программист и для выполнения которых он напишет инструкции. Как утверждает Дайсон, «компьютеры все лучше и лучше справляются с поиском ответов, но только на те вопросы, которые могут задать программисты».
Это принципиально отличается от того, как обрабатывают информацию такие живые системы, как наш мозг. В процессе жизни разум посвящает бо?льшую часть времени и энергии поиску ответов на незаданные вопросы или, по крайней мере, на вопросы, заданные не в конкретных терминах. «В реальном мире, – объясняет Дайсон, – чаще всего найти ответ проще, чем сформулировать вопрос. Нарисовать нечто похожее на кошку, например, гораздо проще, чем описать то, что, собственно, делает нечто похожим на кошку. Ребенок рисует каракули, и в конце концов у него получается что-то напоминающее кошку. Решение находит проблему, а не наоборот». Умными нас делает то, что наш разум постоянно снабжает нас ответами, не зная вопроса. Он находит смысл, а не выполняет вычисления.
Для того чтобы машина могла продемонстрировать или, по крайней мере, имитировать такой процесс, она не должна быть ограничена набором однозначных инструкций для выполнения действий над жестко ограниченным набором данных. Она должна быть освобождена от своей фиксированной памяти. Должна избавиться от своей «машинности» и начать действовать подобно биологической системе. Именно это и становится возможным по мере того, как сам интернет превращается в компьютер. Внезапно вместо конечного набора данных, точно организованных в матрице, у нас появляется избыток данных, циркулирующих в безграничном облаке. У нас есть, если заимствовать метафору, «первичный бульон» информации, которая жаждет обрести смысл. Для этого нам нужно программное обеспечение, которое действует скорее как придающий смысл мозг, нежели как вычислительная машина фон Неймана, – программное обеспечение с инструкциями, которые, как пишет Дайсон, «просто говорят “СДЕЛАЙ ТО-ТО с первой попавшейся копией ТОГО-ТО”».
Мы наблюдаем зарождение нового вида программного обеспечения на примере поисковой системы Google и других программ, предназначенных для извлечения информации из Всемирной паутины. Инженеры компании Google признают, что, как выразился Дайсон, «вне зависимости от того, из чего состоит сеть – из нейронов, компьютеров, слов или идей, – она содержит решения проблем, которые не обязательно должны быть четко определены». Алгоритмы поисковой системы компании уже очень успешно находят в интернете ответы на вопросы, которые мы задаем, даже когда мы формулируем их неоднозначно. Мы не всегда точно знаем, что мы ищем, когда мы производим поиск в системе Google, и все-таки мы часто