параллельного процесса, подобного волновому.
Излагаемая в настоящей работе теория фреймов рассматривает все основные вопросы, поднятые гештальт-психологами. Общим для обоих подходов является стремление раскрыть суть процессов, лежащих в основе соотнесения сенсорных данных либо с общими понятиями, либо с их частями, но методы, предложенные для обоснования выдвинутых положений, в корне отличны друг от друга. Гештальт- психологи стремились доказать, что эти процессы основаны главным образом на взаимодействии небольшого числа универсальных и весьма эффективных процедур, но неудачи с их эффективным выделением показали ограниченность этой идеи. В теории фреймов упор делается на многочисленность взаимодействий между сенсорными данными и образованной в процессе обучения громадной сетью символьной информации. И хотя эти взаимодействия должны, в конечном счете, основываться на том или ином наборе общих принципов, в нашей теории изучение мыслительных процессов отделено от вопросов происхождения и развития систем ИИ.
1.2. Параллелизм
Может ли оказаться полезной параллельная обработка информации? Вопрос этот следует считать чисто техническим в большей степени, чем может показаться на первый взгляд. Действительно, на уровне выявления простейших визуальных черт, текстурных элементов, характерных особенностей при стереоскопическом зрении или двигательном параллаксе использование параллельной обработки информации следует считать целесообразным. На следующем, 'предметном' уровне труднее представить себе, каким образом можно использовать параллелизм, хотя в этой связи следует отметить работы А.Гузмана(1969) по выделению 'ядер' и объединению их в связанные области или Д.Вальтца(1972) по использованию семантических корней для отсортировки теневых линий, выполняемой на специальной параллельной сети.
Однако на более высоких уровнях мыслительной деятельности целесообразность применения параллелизма встречает ряд принципиальных возражений. В работах по распознаванию образов было предложено довольно много схем для выполнения параллельных операций - персептроны, интегральные преобразования и т.д. Эти схемы, интересные и с математической, и с вычислительной точек зрения, видимо, могли бы служить в качестве составных частей теории обработки сенсорной информации, но не более того. Интегральные методы хороши, главным образом, для работы с изолированными двухмерными изображениями, но на их основе нельзя решить задачу выделения и распознавания объектов в сложных трехмерных сценах. Почему?
При анализе сложных сцен должны быть правильно выделены области, принадлежащие различным объектам, ибо только в этом случае воспринимаемая картина обретает смысл; однако для решения этой задачи, которая эквивалентна традиционной в гештальт-психологип проблеме 'объект - фон', требуется так много усилий, что, как отмечалось в работе М.Минского и С.Пейперта(1969), сама возможность и даже целесообразность разработки методики изолированного распознавания ставится под сомнение. Для трехмерных изображений эта проблема еще более осложняется как искажением перспективы, так н тем обстоятельством, что отдельные части предметов оказываются невидимыми из-за других объектов.
В новых знаковых теориях используются методы выработки гипотез с последующим их подтверждением; эти методы кажутся нам более продуктивными. Трудно решить любую по-настоящему сложную проблему, не уделив самого пристального внимания ее отдельным составным частям. К счастью, однако, можно представить себе более эффективный (по сравнению с просто идеей параллелизма) последовательный процесс, при котором крупные, сложные знаковые структуры рассматриваются в качестве простейших операндов. Это открывает теоретически новую возможность для быстрого поиска крупных субструктур н, по-видимому, позволит найти секрет быстродействия механизмов человеческого мышления и восприятия зрительной информации.
1.3. Искусственный интеллект и процессы решения задач человеком
В настоящей работе не проводится границы между теорией человеческого мышления и теорией построения 'думающих' машин: разделять их в данный момент не имеет смысла, поскольку как в той, так и в другой области знаний отсутствуют концепции, достаточно общие для объяснения и тем более для моделирования сложной интеллектуальной деятельности. Однако одно отличие все же имеется. Дело в том, что у специалистов-психологов, работающих над проблемами интеллекта, наблюдается определенная тенденция к сокращению числа различных механизмов, включаемых в модели функционирования человеческого мозга. Это ведет к попыткам достигнуть большего эффекта с помощью меньшего, чем может быть обосновано, числа основных механизмов мышления. Такие теории уделяют недостаточно внимания как вопросам управления психической деятельностью, так и уточнению наших знаний об отдельных интеллектуальных процессах. Ученые, работающие в области ИИ, видимо, сосредоточили все свои усилия именно на этих вопросах, но ни те, ни другие, однако, не придавали должного значения изучению самой структуры знаний, особенно знаний процедурального типа.
Можно понять, почему психологи чувствуют себя не очень уверенно, оперируя сложными схемами, не основанными на тщательно выверенных механизмах мышления. Однако стремление к ограничению их числа еще не соответствует данному этапу развития науки в той мере, в какой это может иметь место в будущем. Анатомия и генетика мозга являются той областью знаний, в которой можно предположить значительно большее число разнообразных механизмов, чем это можно себе представить сегодня. Нам следует сосредоточить свое внимание скорее на проблемах достаточности и эффективности, чем на проблеме необходимости.
Еще несколько лет назад главная цель работ по распознаванию образов сводилась к проблеме достаточности: найти любые пути, ведущие к разработке алгоритмов машинного анализа сцен. Только недавно специалистам удалось обнаружить и реализовать возможности правильного объединения отдельных черт и признаков в законченные структуры образов. Отмечу, прежде всего, работы Л.Робертса (1965), А.Гузмана(1968), П.Уинстона(1970), Д.Хаффмана(1971), М.Клоувза(1971), Дж.Сираи(1972), Д.Вальтца(1972), которые характеризуют собой ряд этапов в разработке вопросов анализа изображений типа 'фигура-фон', 'целое-часть' и выделение структурных групп.
Хотя эти работы достаточно просты, на их основе можно дать не только поверхностное толкование феномена зрительного восприятия, но и в какой-то степени объяснить быстроту и гладкость его протекания. Теория восприятия образов сталкивается с рядом новых вопросов при переходе от проблемы достаточности к проблеме эффективности. Каким образом различные виды 'признаков' могут столь быстро, как это имеет место в человеческой практике, приводить к идентификации и описанию сложных ситуаций? Каковы способы внесения изменений при выявлении ошибок или нахождении новых доказательств? Как разрешаются противоречия? Как может быть изменена информация о местоположении объекта без перевычисления состояний других связанных с ним предметов? Как обстоит дело с движущимися объектами? Каким образом процессы зрительного восприятия используют знания, связанные с общими, невизуальными видами деятельности? Каким образом человек координирует информацию, поступающую из различных источников? Как в системе могут использоваться ожидания относительно результатов предполагаемых действий? Может ли теория объяснить феноменологические результаты зрительного восприятия образов, а также управляемое самим ходом восприятия построение и манипулирование воображаемыми сценами?
В рамках традиционных подходов бихейвористской и перцептуальной психологии было сделано очень мало, чтобы найти ответы на эти вопросы; однако взгляды некоторых работавших ранее психологов (см.Ф.Бартлетт,1932), несомненно, нашли свое отражение в настоящей работе. В более поздних работах по теории символьной обработки информации, в публикациях, подобных статьям А.Ньюэлла(1973) и Л.Пилишина(1973), содержатся более конструктивные предложения по формулированию этих спорных