сложность устройства современного компьютера затруднила бы ученым понимание достаточно простых принципов, лежащих в основе любой вычислительной техники. Эти принципы называются архитектурой фон Неймана и практически не изменились с 1946 года, когда была опубликована статья «Предварительное рассмотрение логического конструирования электронного вычислительного устройства». И неважно, собран ли компьютер на лампах, транзисторах или микросхемах, базовые принципы остаются те же. Любой компьютер имеет память, систему команд, процессор, который умеет эти команды выполнять, программы, состоящие из последовательности команд и устройства ввода-вывода, позволяющие взаимодействовать с внешним миром. Остальные «навороты», возникшие в результате эволюции вычислительной техники, хотя и многократно увеличивают возможности компьютера, не отменяют эти принципы.
Изучение человеческого мозга во многом напоминает изучение сложной системы без понимания ее основных «конструкторских идей». Мы знаем многое о его внутренней структуре, глубоко изучены процессы, протекающие в нейронах, но для многих исследователей обилие разнообразных знаний заслоняет понимание достаточно простых принципов, лежащих в самой основе.
Для иллюстрации того базового принципа, что отвечает за формирование человеческого поведения, покажем, как может выглядеть простейший мозг, например, для робота с лампочками (Рисунок 10).
Рисунок 10. Простейший мозг для робота, способного радоваться и страдать
Обычно нейронные сети конструируют используя формальные нейроны, которые имеют несколько входов и один выход. Эти нейроны выполняют функцию взвешенного суммирования сигналов входов. Они активируются, если сумма превышает определенное пороговое значение. Чтобы упростить схему, мы воспользуемся более сложными нестандартными нейронами. Будем считать, что их связи обеспечивают передачу информации в обе стороны, а то, как они ее обрабатывают, определяется типом нейрона. Из схемы видно, что она состоит из нейронов шести различных типов. Опишем особенности каждого из них:
Устройство с таким мозгом, которое, кстати, несложно реализовать на практике, отчасти ведет себя как живой организм. Сначала его поведение полностью определяется рефлексами и представляет собой реакцию на состояние датчиков. В рефлексы прошиты образы, узнавание которых вызывает ответные реакции. По мере накопления опыта возникает способность узнавать новые изначально неизвестные образы и реагировать на них. В условиях, когда датчиков, отображающих внешний мир, не так много, в памяти могут фиксироваться противоречивые воспоминания. При одной и той же картине одни и те же действия могут вести к разным результатам. Это означает, что либо из-за недостаточности информации были отождествлены две разные внешние ситуации, либо само явление носит случайный характер. Но в любом случае устройство начинает следовать такому поведению, которое с наибольшей вероятностью сулит положительное изменение состояния «хорошо – плохо».
Уместный вопрос: как задать изначальные безусловные рефлексы и рефлексы оценочного восприятия? Природа ответила на этот вопрос, запустив процесс естественного отбора и свойственный ему метод проб и ошибок. Для робота можно попытаться задать рефлексы экспертно, руководствуясь определенной логикой. А можно попытаться повторить путь природы, но тогда придется задать среду, естественный отбор и условия выживания и наследования.
Вся описанная конструкция – это одна из разновидностей персептрона. Персептрон — это нейронная сеть, состоящая из входных (S), ассоциативных (A) и реагирующих элементов (R), с переменной матрицей взаимодействия, определяемой последовательностью прошлых состояний активности сети. Термин был введен Фрэнком Розенблаттом в 1957 году. Ему же принадлежит первая реализация в виде электронной машины «Марк-1» в 1960 году. Персептрон стал одной из первых моделей нейросетей, а «Марк-1» — первым в мире нейрокомпьютером (Rosenblatt, 1962).
Рисунок 11. Персептрон Розенблатта
Сам принцип, когда новый опыт изменяет структуру нейронной сети, называется «обучением с подкреплением». Для персептрона необходимо задать систему управления подкреплением. Задача этой системы - оценить успешность взаимодействия устройства со средой и на основе полученных знаний изменить веса ассоциативных элементов таким образом, чтобы повысить шансы устройства на последующий успех. Что считать успехом – это тот вопрос, который всецело зависит от системы управления подкреплением и соответственно тех задач, для решения которых она создается. В нашем случае система подкрепления — это внешняя среда, оценочное восприятие и характер его участия в формировании памяти.
Разработкой систем, которые действуют по принципу эмоционального управления, успешно занимается Александр Жданов. Описание теории и примеры работающих систем можно найти в его книге «Автономный искусственный интеллект» (Жданов, 2009), которую могу порекомендовать каждому, кто хочет найти строгое формализованное изложение. В свои модели Жданов закладывает те же эмоциональные принципы, что описываем мы в этой книге. В его интерпретации обобщенная схема мозга робота выглядит следующим образом:
Рисунок 12. Адаптивное управление по Жданову
Виртуальный опыт
Приобретать опыт можно не только совершая поступки. Когда мы представляем себе что-либо, мы даем эмоциональную оценку своим фантазиям. И тут же запоминаем этот «виртуальный» опыт, и он моментально начинает управлять нашим поведением наравне с опытом реальным.
Гарвардский невролог Альваро Паскуаль-Леоне в 90-х годах XX века провел серию экспериментов, результаты которых наделали много шума. Он обучал две группы людей играть на пианино. При этом одна группа действительно занималась игрой, а вторая проводила большую часть отведенного времени в «психической тренировке», представляя, как они играют. Оказалось, что обе группы добились одинаковых успехов в игре. Более того, изменения моторных областей коры мозга у людей, выполнявших упражнения в уме, походили по размеру на соответствующие изменения у тех, кто по-настоящему занимался на клавиатуре.
Рисунок 13. Динамика изменения моторной зоны, связанной со средним пальцем. Верхний ряд – реальные упражнения, нижний ряд – мысленные
Получение виртуального опыта через оценку своих же фантазий - это то, чем мы занимаемся постоянно. Когда мы думаем о каком-либо поступке, у нас в воображении проносится картина будущего результата. Эта картина получает эмоциональную оценку, и тут же формируется воспоминание о виртуальном опыте. Далее, в зависимости от знака эмоциональной оценки, память либо будет «толкать» нас на совершение представленного действия, либо наоборот, будет ему «препятствовать». Кстати, именно такое понимание того, как соотносятся фантазии и поведение, примеряет бихевиоризм и когнитивную психологию, так как, с одной стороны, констатирует бессознательную основу всех поступков, а с другой стороны - показывает, как когнитивные процессы меняют память, и, соответственно, влияют на поведение.
Этот несложный принцип