Финансовые информационные технологии поддержки принятия решений на основе больших данных
Традиционно финансовые информационные технологии (ФИТ, или, в просторечии, финтех) интерпретируются как средства автоматизации и виртуализации (перевода в электронную форму) различных бизнес-процессов, связанных с любой финансовой деятельностью: от простейшего бухгалтерского учета до сопровождения банковской деятельности, биржевой торговли и т. д. Однако в условиях глобальной цифровой трансформации ФИТ уже не являются изолированной составной частью финансовой системы и приобретают смысл конвергентной интердисциплинарной технологии, стимулирующей развитие иных цифровых отраслей (например, логистики, ретейла, цифрового производства, цифрового обращения интеллектуальной собственности и пр.). Принимая во внимание размытие границ ФИТ одновременно с увеличением скоростей, масштабов и сложности самих финансовых бизнес-процессов, эффективное управление ими только за счет усилий экспертов (финансовых аналитиков) становится невозможным как в силу временных ограничений, так и по причине высокой степени неопределенности в условиях неполноты исходных данных. Как следствие, в последнее десятилетие в мире активно развивается новый класс ФИТ, реализующий функции поддержки принятия нетривиальных решений в различных аспектах финансовой деятельности на основе объективных фактов, совокупно используя для этого технологии анализа данных и компьютерного моделирования [1].
Необходимость детальной регистрации и хранения данных, генерируемых бизнес-процессами, — это естественная особенность финансовой системы. И неслучайно сегодня эта область является одной из наиболее подготовленных к применению технологий больших данных (Big Data) для своевременного обеспечения информацией, необходимой для работы на различных уровнях: от рынков капитала до индустрии финансовых сервисов [2]. Но реализация задачи интеллектуальной поддержки принятия решений, имитирующей логику финансового аналитика, не ограничивается анализом и обработкой фактических данных. Для нее необходимы механизмы получения формализованных знаний о природе бизнес-процессов из различных источников (экспертные, на основе данных, в виде реалистических или метафорических математических моделей и т. п.). Однако на практике получение и использование таких знаний затруднено тем, что подавляющее большинство финансовых процессов наблюдается лишь фрагментарно. Например, транзакционные данные демонстрируют лишь характеристики и структуру финансовых потоков, однако не способны в полной мере отразить причинно-следственные зависимости между ними, в том числе обусловленные внешними факторами нефинансовой природы. Во многом это усугубляется тем, что глобальные финансовые рынки объединяют множество участников, имеющих разнообразные цели. К ним относятся как потребители (физические и юридические лица), так и провайдеры финансовых сервисов и услуг — коммерческие банки, консалтинговые и инвестиционные компании, ретейл, брокеры и хедж-фонды, рейтинговые агентства, страховые компании и регуляторы. Наличие большого количества конкурирующих стратегий в условиях множественных связей между ними порождает высокую долю неопределенности в части принятия любых управляющих решений: от выпуска банком нового финансового продукта до политики государственного регулятора.
Таким образом, развитие ФИТ-поддержки принятия решений в финансовой сфере требует математического и алгоритмического аппарата, способного сформировать предсказательную модель на наборе бизнес-процессов в условиях неопределенности, идентифицировать эту модель на данных, количественно охарактеризовать меру неопределенности прогнозов и на ее основе определить процедуру сравнения различных сценариев, а также управление их развитием. В целом такая задача не может быть решена средствами классического финансового моделирования и требует его сочетания с технологиями прикладного искусственного интеллекта, преимущественно построенными на методах машинного обучения. Далее рассматриваются ключевые особенности развития этого направления.
Гибридное моделирование как альтернатива формальным подходам
Для управления финансовыми системами важно обеспечение их устойчивого развития, позволяющего заранее обойти или снизить эффект экстремальных явлений (в частности, финансовых кризисов). Их предварительное выявление только на основе описательной статистики, формально экстраполирующее ретроспективные данные, невозможно. Это обусловлено тем, что на разных уровнях финансовая система изменяется эволюционно: данные объективно устаревают и статистические прогнозы, учитывающие только предысторию (например, на уровне корреляционных связей), как правило, не дают требуемой заблаговременности. Потому принципиально важно использование аппарата предсказательных моделей в форме динамических систем, формализующих причинно-следственные связи между различными характеристиками финансовых процессов и внешними факторами. Обычно такие модели основаны на классических объектах финансовой математики: балансовых уравнениях финансовых потоков или метафорических моделях эконофизики (броуновские ценовые модели и пр.). Однако данный математический аппарат предназначен для описания динамики замкнутых финансовых систем с точки зрения генерируемых потоков; связь с внешним миром учитывается параметрически, в виде эвристических замыканий. При этом формализация таких замыканий из «первых принципов», по-видимому, невозможна из-за отсутствия детальной информации о действиях всех участников финансовых рынков и понятных механизмов влияния других систем реального мира (информационной, политической, социальной) в силу интердисциплинарности самой решаемой проблемы. Как следствие, увеличение предсказательных возможностей таких моделей может быть только за счет перехода к гибридному моделированию, когда знания о влиянии внешних факторов, связанных в первую очередь с мотивационными и поведенческими характеристиками участников, отражаются в форме подмоделей, полученных на основе анализа данных.
Многомасштабность и многосвязность финансовой среды
Теоретически возможное желание построить полную модель финансовой системы с участием различных категорий участников (от физических лиц до регуляторов государственного уровня) разбивается об объективное отсутствие данных, необходимых для формализации отношений и характеристик всех участников процесса в рамках гибридного моделирования. Разумным выходом в данной ситуации, наследуемым из вычислительной физики, становится применение принципа многомасштабности, описывающего изменчивость финансовых процессов в различных временных диапазонах (уровнях) набором математических моделей, связанных между собой параметрически. На каждом уровне существуют свои связи между отдельными участниками. Потому, например, финансовая система может быть описана моделью многослойной комплексной сети, узлами на каждом уровне которой являются субъекты финансовых процессов, а связи между ними отражают текущие операции на трех разных уровнях. На индивидуальном, микроуровне модель описывает взаимосвязь финансовых операций, активности и предпочтений самого субъекта (например, физического лица) в условиях информационного обмена с внешней средой. На мезоуровне формализуются связи между различными участниками — субъектами финансового рынка (клиенты одного банка, сообщество банков и т. д., юридические лица — работодатели) и пр. На макроуровне рассматривается сетевая среда участников финансовых рынков, чья активность определяется макроэкономическими закономерностями. В качестве иллюстрации на рис. 1 приведено изображение сети межбанковского кредитования, полученное в ходе моделирования развития кризисной ситуации. Каждый из банков имеет связи, определяющие наличие финансовых отношений, с юридическими лицами (бизнес-структурами) и физическими лицами (клиентами), которые также могут иметь свои связи с бизнес-структурами как с работодателями или провайдерами сервисов. В работе [3] такая модель рассмотрена в применении к задаче моделирования сценариев эволюции банковской системы, в том числе в условиях кризиса.
Финансовое поведение как предмет моделирования
Агрегированные финансовые данные на макро- и мезоуровнях могут обеспечить качественный диагноз ситуации; однако наиболее гибким и удобным для управления финансовыми бизнес-процессами традиционно считается микроуровень, учитывающий индивидуальные особенности физических и юридических лиц — клиентов банков. А потому задача принятия решений тесно связана с прогнозированием финансового поведения на основе моделей, соединяющих конкретные действия клиента (например, заем и возврат кредита, осуществление покупки, посещение офиса банка) с его индивидуальными особенностями и текущим влиянием внешних факторов. При этом в настоящий момент уже не представляют научно-практического интереса технологии, просто имитирующие деятельность экспертов (к примеру, банковских андерайтеров, оценивающих кредитоспособность конкретного человека по набору объективных данных). Напротив, становятся востребованными решения, находящиеся за пределом экспертного восприятия и позволяющие предсказать действия клиента на основе агрегации не столь очевидных данных его индивидуального финансового поведения в динамике. Так, использование данных о динамике транзакционной активности по картам одного из крупных отечественных банков для прогноза просрочки по кредитам позволило на ~30% улучшить результат по сравнению с получаемым экспертно [4]. При этом кажущаяся небольшой доля улучшения в данной ситуации характерна для задач кредитного скоринга в целом, поскольку сам факт нарушения взаимоотношений с банком является редким событием, существенное влияние на которое оказывают форс-мажорные обстоятельства, принципиально не предсказуемые ни моделями, ни даже самим клиентом. Как следствие, прямое использование методов машинного обучения по таким данным обычно не приводит к успеху в силу разбалансированности выборки; это порождает необходимость перехода от бинарных классификационных моделей к моделям на основе рисков, в которых учитывается фактор неопределенности.
В качестве примера на рис. 2 приведена визуализация кластеров клиентов, промаркированных по их склонности к досрочным погашениям кредитов, полученная с помощью метода нелинейного понижения размерности tSNE. Данный пример иллюстрирует логику одного из способов построения производных характеристик финансового поведения клиента по их агрегированным профилям (признаковым описаниям, полученным в результате свертки ассоциированных цепочек событий).
Следует отметить, что финансовое поведение клиентов тесно связано с их деятельностью, в первую очередь с процессами потребления. Поэтому, как правило, такие модели должны обогащаться за счет различных индивидуальных данных (в том числе из открытых источников), напрямую не связанных с финансовой сферой.
Мобильность и геофинансовые технологии
Повседневное финансовое поведение во многом является следствием важнейшего драйвера городской жизни — мобильности населения. Как следствие, учет в предсказательных моделях сведений о географическом расположении пунктов осуществления финансовых операций позволяет не только уточнить предпочтения самих клиентов, но и обеспечить важной информацией потенциальных провайдеров различных продуктов и услуг. Таким образом, модель городской мобильности (определяющая не только корреспонденции, но и их транспортную реализацию) интегрируется с самой моделью городского потребления. Обычно она описывает многомасштабную ритмику случайного процесса потребления различных видов товаров и услуг различными категориями граждан на заданной территории. Эта модель позволяет не только оптимизировать структуру провайдеров услуг, но и более внимательно взглянуть на классическую задачу оптимизации расположения и функций сети банковских офисов или банкоматов. Кроме объективных факторов, таких как мера конверсии клиентов, данный подход позволяет воспроизводить системные поведенческие реакции населения, когда закрытие, казалось бы, невостребованного банкомата или офиса одного банка в скором времени приведет к перетоку клиентов не в иные офисы самого банка, а совсем в другой, находящийся по соседству банк, предоставляющий схожие финансовые сервисы (что особенно важно для крупных городов в условиях передела клиентской среды). На рис. 3 дана иллюстрация процессов перетоков клиентов потенциально закрываемого отделения банка на основе предсказательного моделирования, учитывающего мобильность населения, транспортную доступность иных отделений, а также возможность перехода части клиентов к использованию онлайн-сервисов [5].
При этом важно учитывать рост цифровых механизмов предоставления различных услуг, в том числе предзаказа товаров и услуг через Интернет, осуществляемых потенциально из любой точки города и не связанных непосредственно с мобильностью.
Устойчивые стратегии и проактивность
Логика «жадных решений», обеспечивающая максимальную выгоду за короткое время, далеко не всегда бывает эффективной стратегически. Соответственно, интерес представляют критерии и целевые функции для оптимизации финансовых процессов, направленных на длительную работу клиентов таким образом, чтобы обеспечить его финансовую устойчивость и увеличить лояльность к конкретной финансовой организации. Как правило, это обеспечивается проектированием индивидуальных финансовых продуктов под конкретные характеристики клиента, обеспечивающих гибкую подстройку под его текущее состояние. Таким образом, задача оптимизации доходов банка решается интегрально за интервал времени лояльности клиента за счет механизмов управления его рисками (например, персонализации кредитных условий). На рис. 4 приведена иллюстрация этого принципа на примере совмещения персонифицированной скоринговой модели заемщика и модели доходности банка. Основная идея такого подхода состоит в том, что оптимизация доходности банка должна происходить динамически с учетом лояльности каждого конкретного клиента. При этом стратегия привлечения нелояльных клиентов за счет более выгодных предложений сама по себе обеспечивает повышение лояльности клиента и возможность потенциального увеличения доходности в будущем.
Переход к персонифицированным финансовым продуктам открывает широкие возможности для их проактивного продвижения, основываясь на потенциальных предпочтениях клиента и принимая в расчет актуальность времени и места. Это относится как к самим банковским сервисам (к примеру, своевременно предложенный автокредит), так и к коллаборативным сервисам (например, персональной скидке у определенного провайдера товаров или услуг, обслуживаемого банком). Для этого принципиальным является моделирование не только поведенческой, но и мотивационной составляющей, отражающей процесс формирования и реализацию человеком своих планов, в том числе с использованием формализма BDIAR (Believes, Desires, Intensions, Actions, Reactions). Подобные модели позволяют заранее идентифицировать потребительские планы клиентов, как на транзакционных, так и на открытых, «бытовых» данных социальных сетей. В качестве иллюстрации на рис. 5 приведен пример кластеров потребительской активности клиента на карте Санкт-Петербурга, идентифицированных по комбинации платежных данных и данных открытых источников [6] (для поиска кластеров применен алгоритм пространственной кластеризации DBSCAN).
Новые информационные технологии: коллаборативные биржи данных и цифровые двойники
Реализация принципов гибридного моделирования предусматривает обращение к данным из разных источников, в том числе составляющих банковскую или коммерческую тайну провайдеров услуг и сервисов. Совместная работа с такими источниками данных требует специализированного промежуточного программного обеспечения — коллаборативных бирж больших данных (КББД). Оно реализует модель, при которой несколько равноправных поставщиков данных (банк, ретейлер, авиаперевозчик и пр.) используют массивы больших данных совместно, но для решения собственных задач, в частности для поддержки принятия решений по управлению финансовыми бизнес-процессами. При этом передача сырых данных между поставщиками не производится; вся обработка ведется программной надстройкой над хранилищами данных поставщиков, обеспечивающей бесшовную интеграцию вычислительных процессов с минимизацией передачи самих данных в условиях приемлемого времени расчетов (ограничиваемого бизнес-процессами самих потребителей). Такая модель порождает новые требования к технической инфраструктуре, одновременно меняя сам подход к обработке и анализу данных, делая его распределенным. При этом доверительность взаимоотношений между поставщиками регулируется с помощью механизмов блокчейна, обеспечивающих регистрацию всех фактов использования и перемещения данных. В работе [7] технология КББД описана применительно к задачам сетевого ретейла.
Впрочем, сами по себе данные не являются достаточными для выполнения задач поддержки принятия решений без применения соответствующих моделей на их основе. Это делает полезным использование в ФИТ концепции цифровых двойников — совокупности данных и математических моделей, описывающих жизненный цикл конкретного объекта или изделия. Изначально введенное для технических объектов, понятие цифрового двойника остается справедливым в отношении любого участника финансового рынка, однако для физических лиц (клиентов) трансформируется в понятие цифровой личности, или персоны. Учитывая, что в современном мире подавляющее большинство людей оставляет свои цифровые следы (мобильная связь, социальные медиа, платежи и пр.), сбор, агрегация и структурирование таких данных относятся скорее к техническим вопросам. Но сама цифровая личность, построенная на их основе, может быть использована в разных аспектах. Например, в виде «бытовой» цифровой персоны, ассоциированной с конкретным клиентом банка при реализации стратегии управления жизненным циклом. Или в виде полностью синтетической личности на основе агрегации данных о множестве разных людей, необходимой для тестирования новых финансовых сервисов или цифровых ассистентов. А также в виде цифрового общества — набора взаимодействующих цифровых личностей, влияющих на финансовое поведение друг друга. В работе [8] рассмотрено подобное цифровое общество на примере тематической группы крупного отечественного банка.
Таким образом, активное развитие технологий больших данных, предсказательного моделирования и прикладного искусственного интеллекта обеспечивает новый толчок развития финансовых информационных технологий, позволяя не только автоматизировать существующие бизнес-процессы, но и порождать новые, соответствующие логике глобальной цифровой трансформации как финансовой сферы, так и смежных с ней областей.
В работе использованы
материалы, подготовленные
в рамках проекта РНФ №17-71-30029.
- Seth T.and Chaudhary V. Big Data in Finance. 2015.
- Big Data in Finance and Quantitative Finance. 2017. www.msc.esadeblogs.com/2017/01/18/big-data-in-finance-and-quantitative-finance
- Guleva V. Y. et al. A Simulation Tool for Exploring the Evolution of Temporal Interbank Networks // Journal
of Artificial Societies and Social Simulation. 2017. Vol. 20. No. 4. - Nikitin N. O. et al. Evolutionary Ensemble Approach for Behavioral Credit Scoring. International Conference on Computational Science. Springer, Cham, 2018.
- Zaikin O. et al. Optimizing Spatial Accessibility of Company Branches Network with Constraints. International Conference on Computational Science. Springer, Cham, 2019.
- Derevitskii I., Nuzhdenko I., Bochenina K. Identifying places of financial interest using open data // Procedia Computer Science. 2018. Vol.. 136.
- Nasonov D., Visheratin A. A., Boukhanovsky A. Blockchain-based transaction integrity in distributed big data marketplace. International Conference on Computational Science. Springer, Cham, 2018.
- Severiukhina O. et al. Parallel data-driven modeling of information spread in social networks. International Conference on Computational Science. Springer, Cham, 2018.