Логических Типов, Теория Информации и другие будут нашими проводниками.

'Обучение' компьютеров, крыс и людей

Слово 'обучение' несомненно указывает на изменение некоторого рода. Однако какого рода это изменение - это вопрос деликатный.

Тем не менее, такой обширный общий знаменатель, как 'изменение' дает возможность заключить, что наши описания 'обучения' должны опираться на те же допущения, что и переменные того логического типа, который стал обычным в физических науках со времен Ньютона. Простейшая и самая знакомая форма изменения - это движение, и, даже работая на очень простом физическом уровне, мы должны структурировать наши описания в таких терминах, как 'положение или нулевое движение', 'постоянная скорость', 'ускорение', 'скорость изменения ускорения' и т.д. [2]

2 Уравнения Ньютона, описывающие движение 'частицы', останавливаются на уровне 'ускорения'. Изменение ускорения может произойти только при деформации движущегося тела, но ньютоновские 'частицы' не состояли из 'частей' и потому не были способны (логически) к деформации или другим внутренним изменениям. Следовательно, они не были подвержены изменению ускорения.

Изменение указывает на процесс. Но процессы сами подвержены 'изменениям'. Процесс может ускориться, замедлиться или подвергнуться другим типам изменений, которые позволят сказать, что теперь это 'другой' процесс.

Эти соображения показывают, что нам следует начать организовывать свои идеи относительно 'обучения' с самого простейшего уровня.

Рассмотрим случай специфического отклика, или нулевого обучения. В этом случае объект выказывает минимальные изменения своего отклика при повторяющемся типе сенсорного воздействия. Феномены, достигающие такого уровня простоты, возникают в различных контекстах:

a) при экспериментальных условиях, когда 'обучение' завершено и животное дает приблизительно 100% правильных ответов на повторяющиеся стимулы;

b) в случаях привыкания, когда животное перестает давать явный отклик на ранее беспокоивший стимул;

c) в случаях, когда паттерн отклика минимально детерминирован опытом и максимально детерминирован генетическими факторами;

d) в случаях, когда отклик становится высоко стереотипным;

e) в простых электронных цепях, где структура цепи не может быть изменена в результате прохождения импульсов по этой цепи, т.е. когда каузальные цепи между 'стимулом' и 'откликом', как говорят инженеры, 'запаяны'.

В обычной нетехнической речи слово 'обучение' часто применяется к тому, что здесь называется 'нулевым обучением', т.е. к простому получению информации от внешнего события таким образом, что подобное же событие в соответствующее время в будущем передаст ту же информацию. Например: я 'научился' узнавать по фабричному гудку, когда наступает двенадцать часов.

Также интересно отметить, что в рамках нашего определения многие очень простые механические устройства выказывают по меньшей мере феномен нулевого обучения. Вопрос, следовательно, не в том, 'могут ли машины учиться', а в том, какого уровня обучения достигла данная машина. Стоит уделить внимание экстремальному, хотя и гипотетическому, случаю.

'Игрок' в игре фон Неймана есть математическая фикция, сравнимая с евклидовой прямой в геометрии или ньютоновской частицей в физике. По определению, 'игрок' способен выполнить все вычисления, необходимые для решения любой проблемы, возникающей в игре; он не способен не выполнить эти вычисления там, где они необходимы; он всегда подчиняется результатам своих вычислений. Такой 'игрок' получает информацию от событий игры и действует в соответствии с этой информацией. Но его обучение ограничено тем, что здесь называется нулевым обучением.

Исследование этой формальной фикции расширяет наше определение нулевого обучения.

(1) От событий игры 'игрок' может получать информацию более высокого или более низкого логического типа и использовать эту информацию для принятия решений более высокого или более низкого уровня. То есть его решения могут быть либо стратегическими, либо тактическими, и он может идентифицировать и отвечать как на тактические, так и на стратегические действия своего противника. Однако верно, что в формальном определении игры фон Неймана все проблемы, предоставляемые игрой, считаются вычислимыми, т.е. хотя игра и может содержать проблемы и информацию многих различных логических типов, иерархия этих типов строго конечна.

Становится ясно, что определение нулевого обучения не зависит ни от логической типизации получаемой организмом информации, ни от логической типизации принимаемых организмом адаптивных решений. Очень высокий (однако конечный) порядок сложности может характеризовать адаптивное поведение, не базирующееся ни на чем, превышающем нулевое обучение.

(2) 'Игрок' может вычислить ценность полезной для себя информации, а также вычислить, что эта информация стоит того, чтобы ее получить путем 'разведывательных' ходов. Или же он может делать пустые и пробные ходы в ожидании нужной информации.

Из этого следует, что крыса, занятая исследовательским поведением, может делать это на базе нулевого обучения.

(3) 'Игрок' может вычислить, что ему могут быть выгодны случайные ходы. При игре в монетку он может вычислить, что, выбирая 'орел' или 'решку' случайным образом, он будет иметь равный шанс на победу. Если он использует некоторый план, то этот план проявится как паттерн (избыточность) в последовательности его ходов и его противник получит таким образом информацию. Следовательно, 'игрок' выберет случайную игру.

(4) 'Игрок' не способен на 'ошибку'. Он может (по серьезным причинам) делать случайные либо разведывательные ходы, но он по определению не способен 'учиться методом проб и ошибок'.

Если мы полагаем, что в названии этого учебного процесса слово 'ошибка' означает то же, что мы имели в виду, когда говорили, что 'игрок' не способен на ошибку, тогда 'пробы и ошибки' исключаются из репертуара 'игрока' фон Неймана. Фактически 'игрок' фон Неймана заставляет нас очень тщательно исследовать то, что мы имеем в виду под 'обучением методом проб и ошибок', а также, разумеется, всего, что имеется в виду под обучением любого рода. Предположение, связанное со значением слова 'ошибка', нетривиально и должно быть исследовано.

В определенном смысле 'игрок' может ошибаться. Например, он может принять решение по вероятностным соображениям и затем сделать ход, который в свете ограниченной доступной информации является правильным с наибольшей вероятностью. Когда же становится доступно больше информации, он может обнаружить, что ход был ошибочным. Но это открытие ничего не может прибавить к его будущим навыкам. По определению, игрок правильно использовал всю доступную информацию. Он правильно оценил вероятности и сделал ход, который был правильным с наибольшей вероятностью. Открытие того, что в некоторый момент он ошибся, не может иметь отношения к будущим ситуациям. Если впоследствии возникнет та же проблема, он проделает те же вычисления, придет к тем же решениям и будет прав. Более того, набор альтернатив, из которого он будет делать свой выбор, будет все тем же набором. И это правильно.

По контрасту, организм способен ошибаться многими 'способами', на которые 'игрок' не способен. Эти неправильные выборы уместно назвать 'ошибками' в том случае, когда они имеют такой характер, что дают организму информацию, способную увеличивать его будущие навыки. Во всех этих случаях некоторая доступная информация либо игнорируется, либо используется некорректно. Можно классифицировать различные виды таких полезных ошибок.

Предположим, что внешнее событие содержит детали, которые могут сообщить организму:

a) из какого набора альтернатив он должен выбрать свой следующий ход;

b) какой элемент этого набора он должен выбрать. Такая ситуация допускает двоякого рода ошибки:

(1) организм может правильно использовать информацию, которая говорит, из какого набора альтернатив он должен выбрать, но выбрать неправильную альтернативу внутри этого набора;

(2) он может выбрать из неправильного набора альтернатив.

(Имеется также интересный класс случаев, в которых наборы альтернатив содержат общие элементы.

Вы читаете Экология разума
Добавить отзыв
ВСЕ ОТЗЫВЫ О КНИГЕ В ИЗБРАННОЕ

0

Вы можете отметить интересные вам фрагменты текста, которые будут доступны по уникальной ссылке в адресной строке браузера.

Отметить Добавить цитату