рассказ.
Начну со своего детского воспоминания. Когда я рос в пустыне южного Нью-Мехико, я обратил внимание на полосы, оставляемые на грунтовой дороге проезжающими автомобилями. На дороге появлялись волнистые выпуклые поперечные полосы, как вельветовые рубчики, которые представляли собой естественным образом образующуюся бесконечную последовательность «лежачих полицейских». Расстояние между полосами определялось средней скоростью движения автомобилей по этой дороге.
Когда вы ехали с этой средней скоростью, меньше трясло. Полосы были видны лишь на закате, когда горизонтальные красные солнечные лучи высвечивают все неровности на земле. Днем нужно было ехать осторожно, чтобы не пропустить эту информацию, спрятанную на дороге.
Цифровые алгоритмы должны подходить к проблеме распознавания образов подобным косвенным путем, и им часто приходится применять общую процедуру, немного похожую на проезд виртуальных колес по виртуальным неровностям. Она носит название «преобразование Фурье». Преобразование Фурье определяет объем деятельности, проходящий на конкретной «скорости» (частоте) в блоке цифровой информации.
Представьте себе графический дисплей эквалайзера, имеющийся на аудиопроигрывателях и показывающий интенсивность воспроизведения музыки на разных частотных полосах. Именно преобразование Фурье производит разделение частотных полос.
К сожалению, преобразование Фурье не в состоянии распознать мимику, однако существует связанный с ним, но более сложный алгоритм — фильтр Габора для небольших волн, который нам и поможет. Этот математический процесс идентифицирует отдельные маркеры деятельности на конкретных частотах в конкретных местах, в то время как преобразование Фурье лишь сообщает, какие вообще частоты присутствуют.
Существуют поразительные параллели между теми процессами, что происходят в инжиниринге, и теми, что наблюдаются в человеческом мозгу, включая двойственность Платона/Дарвина: новорожденный младенец способен отследить простое схематическое лицо, но ребенку постарше нужно наблюдать людей, чтобы научиться отличать их друг от друга.
Я рад сообщить, что группа ученых из Хартмута заработала высшие баллы в соревновании по распознаванию лиц, спонсированном правительством. Национальный Институт стандартов и технологии проводит тестирование систем распознавания лиц с той же целью, что лекарств и машин: люди должны знать, кому и чему можно доверять.
И теперь у нас появляются теории — или по крайней мере мы можем кое-что подробно рассказать о том, как мозг распознает объекты этого мира, такие как улыбка, например. Но рот производит гораздо больше движений, чем просто улыбается. Есть ли возможность расширить наш рассказ, чтобы объяснить, что такое слово и как мозг узнает его?
Оказывается, лучше всего подойти к этому вопросу через рассмотрение совершенно иного чувства. Вместо зрения и слуха, возможно, нам полезнее начать с изучения запахов, ощущаемых человеческим носом.
Около двадцати лет я выступал с лекциями об основах виртуальной реальности. Я рассказывал про главные характеристики зрения и слуха, а также осязания и обоняния. В конце лекции начинались вопросы, и одним из первых обычно был вопрос об обонянии: скоро ли у машин виртуальной реальности появится способность чувствовать запахи?
Возможно, но, скорее всего, лишь несколько. Запахи фундаментально отличаются от образов или звуков. Последние могут быть разделены на исходные составляющие, которые относительно просто обработать компьютеру — и мозгу. Видимые цвета — всего лишь слова, состоящие из различной длины световых волн. Любая звуковая волна состоит из множества синусоид, каждая из которых легко может быть описана математически. Каждая похожа на «лежачего полицейского» определенной высоты с грунтовых дорог моего детства.
Иначе говоря, цвета и звуки могут быть описаны с помощью нескольких чисел, широкий спектр цветов и тонов описывается с помощью интерполяции этих чисел. Человеческой сетчатке необходимо воспринимать лишь небольшое количество длин волн или цветов, чтобы наш мозг сумел воспринять все промежуточные. Компьютерная графика работает подобным образом: экран пикселей, каждый из которых способен передать красный, зеленый или синий, может воспроизвести приблизительно все цвета, которые определяет мозг.[23] Музыкальный синтезатор можно представить себе как устройство, генерирующее множество синусовых волн, затем налагающее их друг на друга, чтобы произвести набор звуков.
Запахи очень различаются, как и метод, которым мозг их воспринимает. Глубоко в носу, в глубине слизистой оболочки, находится кусочек ткани — обонятельный эпителий, — пронизанный нейронами, определяющими химические вещества. Каждый из этих нейронов содержит молекулы белка в форме чашечки, называемые обонятельными рецепторами. Когда определенная молекула попадает в подходящий рецептор, возбуждается нейронный сигнал, передающийся в мозг как запах. Молекула вещества, которая слишком велика, чтобы войти в какой-то рецептор, не имеет запаха. Число различимых запахов ограничено только числом обонятельных рецепторов, способных взаимодействовать с ними. Нобелевские лауреаты 2004 года в области психологии и медицины Линда Бак из Центра исследования рака Фреда Хатчинсона и Ричард Эксель из Колумбийского университета обнаружили, что человеческий нос имеет около тысячи различных типов обонятельных нейронов, причем каждый способен распознавать определенный набор химический веществ.
Все вышесказанное указывает на глубокое различие в базовой структуре чувств — различие, порождающее важные вопросы о том, как же мы мыслим, и, вероятно, даже о происхождении языка. Невозможно интерполировать две молекулы запаха. Запахи могут смешивать и создавать миллионы различных сочетаний, это верно. Однако существующие запахи невозможно разбить на несколько базовых единиц, «пикселей запаха» не существует. Можно выразить это так: цвета и звуки можно измерить с помощью линейки, но запахи нужно искать в словаре.
Для техника виртуальной реальности это досадно. Существуют тысячи основных запахов — гораздо больше, чем группка основных цветов. Возможно, однажды мы сумеем подсоединить провода к мозгу человека, чтобы создать иллюзию запаха. Но потребуется множество проводов, чтобы подсоединиться ко всем статьям в мозговом словаре запахов. С другой стороны, мозг должен иметь возможность организовать все эти запахи сам. Вероятно, на каком-то уровне из запахов вырисовывается некая картина. Возможно, «пиксель запаха» все же существует.
Я долгое время обсуждал эту проблему с Джимом Боуэром, компьютерщиком-неврологом из Техасского университета (Сан-Антонио), известным своими биологически точными компьютерными моделями мозга. Вот уже несколько лет Джим и сотрудники его лаборатории ищут подходы к пониманию «словаря запахов».
НЕ ЗАБЫВАЙТЕ, ЧТО ЗАПАХИ НЕ ЯВЛЯЮТСЯ ЭНЕРГЕТИЧЕСКИМИ СТРУКТУРАМИ, КАК ЗРИТЕЛЬНЫЕ ОБРАЗЫ ИЛИ ЗВУКИ. ЧТОБЫ ОЩУТИТЬ АРОМАТ ЯБЛОКА, ВЫ ФИЗИЧЕСКИ ПРИНОСИТЕ СОТНИ ТЫСЯЧ МОЛЕКУЛ ЯБЛОКА В ВАШЕ ТЕЛО. ВЫ НЕ ОБОНЯЕТЕ ВЕСЬ ПРЕДМЕТ, ВЫ ЗАБИРАЕТЕ ЧАСТЬ ЕГО И СВЕРЯЕТЕСЬ СО СВОИМ СЛОВАРЕМ ЗАПАХОВ, ЧТОБЫ НАЙТИ СООТВЕТСТВУЮЩУЮ ССЫЛКУ.
Они предполагают, что обонятельная система организована далеко не так, как специалист по органической химии организует молекулы (например, по числу атомов углерода в каждой). Напротив, она скорее напоминает сложную систему взаимосвязи химических веществ в реальном мире. Так, многие химические вещества, обладающие сильным запахом, — вещества, которые раздражают обонятельные нейроны, — взаимосвязаны со многими стадиями разложения или созревания органических веществ. Оказывается, существуют три основных индивидуальных химических способа разложения, каждый из которых, похоже, вносит свой набор статей в мозговой словарь запахов.
Джим уверен, что для решения проблемы обоняния, т. е. чтобы быстро определять и различать