Группировка операций находится в самом ядре таких прогнозов. Каждая группа может моделироваться по-разному, а все модели групп вместе могут быть объединены, чтобы агрегировать оценки. Группы формируются на основании различных параметров, например:
• контрагент;
• признак (доход или расход);
• категория (зарплата, квартплата, еда, образование, досуг и т. д.);
• тип (точка продаж, кредитная карта, распоряжение о постоянных платежах и т. д.);
• геолокация.
Динамическая группировка (см. рис. 1) также может основываться на неоднородности показателей[137], но данные об операциях обычно имеют достаточно характерную структуру, чтобы удовлетворять указанным параметрам.
Стандартная модель генерирует серединное значение и значения, соответствующие 0,05/0,25/0,75/0,95.
Как правило, группы, используемые в качестве выборки, слишком малы, чтобы предоставлять точную статистику, поэтому принимается непрерывная выборка и используется квантильная интерполяция. Наша модель основывается на средних значениях вместо серединных значений и/или рассчитывает взвешенную оценку, где основной акцент делается на базе новой информации.
Существует множество различных техник, применимых к динамическим рядам, например:
• симуляция списания средств ATM по скрытой модели Маркова;
• иерархические динамические ряды (например, вложенные категории операций, формирующие иерархию);
• копула (связка) для симуляции влияния события на многочисленные группы и межгрупповые зависимости.
В 2010 г. компания SAP выпустила свой продукт HANA, который является высокопроизводительной системой управления реляционной базой данных, загруженной в оперативную память. Платформа HANA поставляется с инструментами прогнозирования, включающими многочисленные алгоритмы и R-интеграцию. Она может быть интересной альтернативой разработке системы с нуля[138]. Oracle предлагает похожие платформы и решения, например колоночные прогнозы и концепции автоматизированного анализа данных[139].
Исследования и тестирование
Тестирование в настоящее время осуществляется на двух разных реальных наборах данных. Первый включает 3741 операцию, охватывающую семь лет одного текущего счета, а второй – 434 операций, полученных из статистики трехлетнего текущего счета. В рамках наборов данных можно взять последовательность, включающую информацию за два года в качестве входных данных, и сравнить результаты с существующими данными (см. рис. 2).
Алгоритмы прогнозирования тестировались на семилетних статистических данных. Было обработано пошаговое введение двухлетних данных, и финальные прогнозы сравнивались с реальными данными. Результат, показанный на рис. 2, получен из расчета стандартной модели (порядковая статистика). Видно, что прогнозы переоценивают негативные и позитивные тенденции, что может быть в дальнейшем скорректировано при помощи взвешенных оценок. Когда используются взвешенные оценки, разница между результатами тестирования на исторических данных и реальными данными может потребоваться, чтобы запустить на используемых весах алгоритм оптимизации. Таким образом можно задать оптимальный вес для каждого отдельного пользователя, но остается риск новых данных, которые должны учитываться и доминировать над старыми данными.
Размышления о бизнесе и интеграции
Интеграция с онлайн-банкингом может быть многообразной, как показывает структура ценообразования на рис. 3. Прогноз движения денежных средств, например, может стать источником для интеллектуальной семантической поисковой машины. Он также может быть частью серверных продуктов и так называемых частных финансовых управляющих (ЧФУ).
Структура ценообразования, указанная в таблице 2[140], может следовать обычным моделям «ПО как услуга»:
• предварительная плата взимается за установку системы. Благодаря требованиям к защите данных систему придется развертывать в центрах обработки данных с высокими требованиями безопасности или непосредственно в помещении банка. Также необходима высокая степень адаптации;
• ежемесячная или ежеквартальная комиссия за предоставление ресурсов может быть достаточно низкой и обеспечивать базовый уровень услуг и затрат на инфраструктуру. Если контракт предполагает автоматическое обновление возможностей, комиссия может оказаться выше;
• в конечном счете цены за проведение операций учитывают все запросы, направляемые на сервер прогнозирования, и постоянно выставляют счета, например, за тысячу запросов.
Использование прогнозной аналитики в МСБ
Согласно ряду интервью с руководителями МСБ, бухгалтерами по налогообложению, а также с управляющими банками и менеджерами по работе с клиентами, всем им нужна прогнозная аналитика. С одной стороны, она поможет принимать лучшие решения, с другой – поможет в борьбе с финансовой неграмотностью и предоставит владельцам и менеджерам наглядную визуализацию и понимание зависимостей и уровня сложности, а также позволит планировать будущие сценарии денежных операций.
Было бы интересно прогнозировать следующие цифры:
• движение денежных средств;
• влияние колебания обменного курса;
• спрос на специальные продукты, например количество возобновляемых кредитных линий, деривативные/хеджевые инструменты для специальных продуктов или валют.
Платформа прогнозирования должна быть обеспечена высокопроизводительным интерфейсом взаимодействия с внешними источниками данных.
• Макроэкономические данные. Пользователей системы могут попросить предоставить дополнительные данные, такие как геолокация, размер (доход, количество сотрудников), отрасль, обычное местоположение, а также отрасль производителей и клиентов. Эти исходные данные могут сформировать основание для загрузки приблизительных внешних макроэкономических данных в прогнозы.
• Системы хранения данных/бухгалтерские/ERP/CRM-системы. В зависимости от размера и отрасли компании должна применяться одна из этих систем. Их данные могут использоваться непосредственно в качестве необработанных входных данных для алгоритмов прогнозирования или – будучи агрегированными или результатом прогноза – формировать факторы при планировании сценариев.
• Дополнительные банки. Как только компания достигает определенного размера, высока вероятность того, что ей потребуются связи с другими банками, например договор аренды или ссуда под недвижимость в другом финансовом учреждении. Это даже может быть синдицированный банковский кредит или более крупные денежные средства. Стандарты отрасли и финтех-компании, такие как FIGO, предлагают связываться с этими банками и получать их транзакционные данные, возможно даже в режиме реального времени.
Прорывной характер таких методов может быть довольно широкомасштабным. Он оказывает немедленное влияние на консультантов, бухгалтеров по налогообложению и сотрудников компании. Банки, которые располагают такими данными, могут изменить цену финансовых инструментов и, в конечном счете, даже котировки риска.
Выводы
Алгоритмы прогнозирования – очень перспективная и интересная сфера для исследований. Кроме того, уже есть первые очевидные и доступные результаты, вокруг которых можно выстроить надежные бизнес-модели, как показано на примере денежных потоков частных клиентов.
Модное словечко «казна как услуга» подводит итог паре интересных возможностей по дальнейшей реализации. В частности, использование алгоритмов прогнозирования в сочетании с онлайн-банкингом и банковскими данными – может, даже в сочетании с внешними источниками – очень перспективно. В конечном счете это может привнести новую функциональность в пользовательский сегмент микрокорпораций.
Однако существует еще ряд препятствий, которые необходимо преодолеть. Статистические методы могут предлагать непроверенные результаты и методологически неправильные модели. Также банковские серверные решения иногда еще не способны предоставлять необходимые данные в нужное время или качество данных может быть неподходящим. И, в конце концов, всегда есть риск того, что пользователи не проявят интереса к результатам работы алгоритма или окажутся неспособны с ними работать.
Успешное внедрение прогнозов движения денежных средств частных клиентов – первый шаг на