корреляции не всегда очевидны для аналитика, однако, для систем data mining числа — родная стихия. Системы data mining не имеют обыкновения забывать или упускать из внимания сколь бы то ни было «незначительные детали» и закономерности — это свойство делает их полезным инструментом информационно-аналитической работы.

Принцип функционирования систем интеллектуального анализа данных состоит в том, что на основе анализа потока данных, поступающих от разнообразных источников информации, формируется информационный образ неким образом интерпретируемой ситуации, который в ходе дальнейшей эксплуатации системы может быть «узнан», о чем и информируется потребитель. Отрасль, для которой создается такая система, на этапе разработки, в принципе, не существенна, поскольку важен лишь принцип формирования системы признаков и класс данных, на которые ориентирована данная система (количественные, качественные).

Адаптация к предметной области этого класса программного обеспечения заключается в том, что предметная область подлежит моделированию и описанию в виде совокупности измеримых атрибутов. Поведение этих атрибутов во времени неким (наперед неизвестным) образом характеризует состояние и поведение систем. С точки зрения исследователя интерес представляет именно то, каким образом наблюдаемые ситуации и тенденции отражаются в имеющемся наборе атрибутов, не существует ли неких признаков, характеризующих начальный период зарождения негативной или позитивной тенденции, скатывания к неким сценариям в развитии ситуации и т. п.

Еще раз заметим: системы data mining не работают напрямую с текстами произвольного формата и данными, которые не могут быть непосредственно сопоставлены. Максимум, что они «могут», если не располагают тезаурусом, характерным для данной предметной области — это работа со структурно-статистическими признаками и временными распределениями.

Если разобраться, то, на самом деле, такие системы могут оказаться полезными даже в случае отсутствия интепретанты у впервые проявившегося признака, поскольку системы интеллектуального анализа данных способны лишь акцентировать внимание аналитика на неких всплесках, по совокупности интегральных или частных показателей отличающих ситуацию от эталона нормы. Какую именно интерпретацию получат эти признаки — вопрос квалификации аналитика, поскольку задача систем интеллектуального анализа данных — это выделение сэмпла, но никак не снабжение его некой семантикой. Системы этого типа работают подобно периферийному зрению человека — они реагируют лишь на изменения (периферийное зрение человека обеспечивает только сигнализацию о перемещениях в «опасной» зоне, но за распознавание движущегося объекта оно не берется).

Обращают на себя внимание попытки вхождения на уровень таких, казалось бы, трудно формализуемых отношений, как политика. Подобные системы не пытаются подменить аналитика, взвалив на себя весь интеллектуальный процесс, связанный с формированием политической стратегии (социализацией идей), однако способны выступать в роли хорошего помощника, способного непредвзято оценить пользу от предпринятых политических шагов. Для того, чтобы система смогла стать таким помощником, пользователю нужно «разъяснить» автоматизированной системе преследуемые им цели и рассматриваемые способы достижения этих целей, «проинформировать» систему о тех политических силах, чьи интересы, следует учитывать при решении задачи, отношениях между вероятными политическими сторонниками и противниками, возможных препятствиях на пути достижения целей и вероятных причинах их возникновения. Лишь после этого встроенная экспертная система будет способна оказать пользователю помощь в разработке альтернативных вариантов стратегии достижения целей, сопоставить эти варианты, а также оценить результативность предпринятых политических шагов. Далее начинается работа, собственно, системы искусственного интеллекта, которая на основе поставляемых ей данных (отклики прессы, рейтинги, результаты голосования и т. д.) предпримет попытки оценивания результативности целенаправленной деятельности. По результатам работ обычно предоставляется набор графиков, текстов и диаграмм, обеспечивающих возможность системного видения проблемы и путей ее решения.

Доступным примером, на котором можно испытать возможности такого рода систем, может служить распространяемая на основе лицензии Shareware «облегченная» версия программного обеспечения PolicyMaker Lite (PoliMap, США, http://www.polimap.com). Данный программный продукт специально разработан для ведения политического анализа и позволяет оценивать расстановку действующих политических сил при осуществлении политической активности (например, при продвижении законодательных инициатив, ведении внутрипартийной борьбы или в ходе выборов). И хотя в этой системе (по крайней мере, в той демонстрационной версии, которая предлагается на пробу заинтересованным лицам) явно перевешивает блок экспертных знаний, ознакомление с ней может оказаться весьма поучительным.

Назвать такие системы разумными нельзя, но на звание электронного интеллектуального помощника они вполне могут претендовать. Часто по своим функциями системы этого типа занимают позицию между инструментальными средствами формального моделирования и средствами активизации мыслительной деятельности.

9.5 Средства структурирования и визуализации данных. Электронные помощники аналитика

Над решением проблемы визуализации и структурирования данных работали крупнейшие ученые (достаточно вспомнить Аристотеля, ведь логика — это одна из систем визуализации рассуждений). Рассматривая технологии работы с текстами, мы уже уделили немалое внимание проблеме структурирования данных, но позволим себе еще раз вернуться к этой проблеме.

Как часто случается, что после тщетных размышлений над некоторой проблемой в прыгающем на колдобинах ГАЗике, садишься за стол, берешь бумагу, карандаш и… все сложное становится простым (правда, иногда случается и обратное!). И не потому, что в условиях тряски нейроны, вынужденные цепляться своими дендритами, аксонами и синапсами друг за дружку, забывают о своем высоком предназначении (лишь бы не рассыпалась пресловутая нейронная сеть).

Дело в том, что оперировать знаками легче, когда они наблюдаемы, а не роятся в голове вперемешку с мыслями об удержании в себе содержимого желудка. Причем способ наблюдения несущественен: например, еще одним приемом «визуализации» является проговаривание цепочки рассуждений. Дети часто пользуются этим приемом, более того, использовать его рекомендуют и психологи, но мы-то умные, да взрослые, и позволяем себе такое только в одиночестве или в состоянии, когда уже впору идти на прием к доктору. Проворачивать в голове сложные многосвязные структуры знаковой природы очень сложно, а без них, увы, вся логика повисает в воздухе. Знаки же человек привык воспринимать либо с помощью зрения, либо с помощью слуха — вот и вся разгадка (кто на что учился, как принято говорить).

Разберемся с тем, что наизобретали умнейшие… Итак: рисунки и иероглифика, письменность, формальные знаковые системы, таблицы, матрицы, графики, плоскостные развертки, сечения и аксонометрические проекции многомерных графиков, графы, сети, диаграммы, многомерные таблицы и массивы, сетчатые рельефы, псевдотрехмерные текстурные рельефы, виртуальная реальность… Внушительный перечень, но… неполный — одних диаграмм можно насчитать массу разновидностей, не говоря уже о прочих способах визуализации данных.

Собственно, в ряде приложений визуализация данных является одним из эффективных способов упорядочения — зачем проводить сортировку неупорядоченных пар данных, если они могут быть непосредственно нанесены на график и считаны с приемлемой точностью? Более того: таким способом часто восстанавливаются и пропущенные измерения. Другой пример — использование сечений на трехмерной модели рельефа позволяет легко установить зону затопления в весенний паводок, в то время как обсчитать такую модель очень непросто.

Короче говоря, что хорошо аналитику, то программисту — чистая мука. Работа с графикой — одна из тех отраслей, в которой приходится помнить высшую математику с аналитической геометрией, чего не требуется при разработке большинства прикладных программ. По этой причине на рынке программного

Добавить отзыв
ВСЕ ОТЗЫВЫ О КНИГЕ В ИЗБРАННОЕ

0

Вы можете отметить интересные вам фрагменты текста, которые будут доступны по уникальной ссылке в адресной строке браузера.

Отметить Добавить цитату
×