Логистический нейросетевой метод построения динамических моделей банкротств при неполных данных
Бесплатно
Основная коллекция
Тематика:
Логистика
Издательство:
Науковедение
Год издания: 2014
Дополнительно
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Интернет-журнал «НАУКОВЕДЕНИЕ» Выпуск 2, март – апрель 2014 Опубликовать статью в журнале - http://publ.naukovedenie.ru Институт Государственного управления, права и инновационных технологий (ИГУПИТ) Связаться с редакцией: publishing@naukovedenie.ru 1 http://naukovedenie.ru 136EVN214 УДК 338.27 Горбатков Станислав Анатольевич Уфимский филиал ФГОБУ ВПО «Финансового университета при Правительстве Российской Федерации» Россия, Уфа1 Профессор, доктор технических наук E_Mail: sgorbatkov@mail.ru Белолипцев Илья Игоревич Уфимский филиал ФГОБУ ВПО «Финансового университета при Правительстве Российской Федерации» Россия, Уфа Преподаватель E-Mail: red7315@gmail.com Фархиева Светлана Анатольевна Уфимский филиал ФГОБУ ВПО «Финансового университета при Правительстве Российской Федерации» Россия, Уфа Доцент, кандидат технических наук E-Mail: ok-xi@yandex.ru Логистический нейросетевой метод построения динамических моделей банкротств при неполных данных Аннотация: До настоящего времени не были исследованы нейросетевые динамические модели оценки вероятности риска банкротств, которые представляют большой практический интерес. Знание динамики развивающего процесса банкротства позволяет в каждый момент времени определить стадию банкротства и применить упреждающие управляющие воздействия. Однако на пути создания динамических моделей риска банкротства возникают труднопреодолимые препятствия в виде неполноты данных. В данной статье предложен оригинальный нейросетевой итерационный гибридный метод оценки вероятности развивающегося во времени риска банкротства предприятий. Метод ориентирован на применение в сложных условиях моделирования: неполноты данных и сильного их зашумления. Вычислительные эксперименты подтвердили эффективность основной идеи разработки гибридного нейросетевого метода построения динамической модели банкротств с непрерывным временем. Разработанный метод может быть использован в широком спектре прикладных задач: оценки кредитоспособности заемщика, обеспечения экономической безопасности предприятий путем постоянного мониторинга их финансового состояния, оценка инвесторами объектов инвестиций, оценки финансовоэкономической состоятельности контрагентов в сделках и др. Предложенные инструментарии выходят за рамки рассмотренных выше задач и могут быть использованы в других динамических задачах с неполными данными при моделировании экономических объектов. Ключевые слова: Диагностика банкротств; неполные данные; нейросеть; динамическая модель; риск; логистический метод; гибридный метод; оценка. Идентификационный номер статьи в журнале 136EVN214 1 450015, г. Уфа, ул. Мустая Карима 69/1, Уфимский филиал Финансового университета при Правительстве Российской Федерации
Интернет-журнал «НАУКОВЕДЕНИЕ» Выпуск 2, март – апрель 2014 Опубликовать статью в журнале - http://publ.naukovedenie.ru Институт Государственного управления, права и инновационных технологий (ИГУПИТ) Связаться с редакцией: publishing@naukovedenie.ru 2 http://naukovedenie.ru 136EVN214 Введение Математические модели оценки вероятности риска банкротств в настоящее время актуальны в связи со многими приложениями в реальном и финансовом секторах экономики. К ним относятся задачи оценки банкротств корпораций; оценки финансово-экономической состоятельности контрагентов в сделках; оценки инвестиционной привлекательности предприятий; обеспечения экономической безопасности предприятий путем постоянного мониторинга их финансового состояния; оценки банком кредитоспособности заемщиков; при выработке управленческих решений по налоговому регулированию (управлению) на местном уровне и во многих других экономических приложениях. Методы моделирования оценки риска банкротств развивались начиная с пионерских работ Альтмана (1968г.) [1] и его последователей, где использовались различные версии линейного метода множественного дискриминантного анализа (MDA). Эти методы оказались практически неприменимыми для российских предприятий по трем причинам: 1. различия в законодательстве (инвестиции на Западе более защищены законодательством, чем в России); 2. различия в стандартах бухгалтерской отчетности; 3. отсутствие глубокой адаптации моделей банкротств для различных стран и отраслей экономики. В связи с указанными причинами в России были предприняты многочисленные попытки совершенствования MDA – линейных моделей, а также появившихся в 1980 г. логистических моделей банкротств [2]. Бурное развитие в России в последнее 20-летие интеллектуальных информационных технологий, в частности нейросетевых [3], открыло принципиально новые возможности в аспектах: Учета нелинейной связи моделируемого показателя Y с вектором экономических показателей (факторов) анализируемого объекта и окружающей среды , (1) где – нелинейная функция. Создания моделей банкротств в условиях сильного зашумления данных, отягченного их дефицитом. Однако до настоящего времени не исследованы нейросетевые динамические модели оценки вероятности риска банкротств, которые представляют наибольший практический интерес. Знание динамики развивающего процесса банкротства позволяет в каждый момент времени определить стадию банкротства и применить упреждающие управляющие воздействия. На пути создания динамических моделей риска банкротства предприятий возникают труднопреодолимые препятствия в виде неполноты данных. Суть проблемы заключается в следующем. Пусть имеются данные наблюдения вектора в нескольких временных срезах , т.е. известны значения всех факторов во временных срезах , . Пусть обучающая выборка D содержит наблюдения для нескольких предприятий , где < , > – знак кортежа; g – номер предприятия. При этом в последнем временном срезе (k=N), как правило, известны векторы значения факторов , а ) ,..., ,..., , ( ), ( ˆ 2 1 n j x x x x x x Y ) ( х N k tk ,..., 2,1 , jk x N k n j ,1 ; ,1 G g x y gk gk ,1 , , gN x
Интернет-журнал «НАУКОВЕДЕНИЕ» Выпуск 2, март – апрель 2014 Опубликовать статью в журнале - http://publ.naukovedenie.ru Институт Государственного управления, права и инновационных технологий (ИГУПИТ) Связаться с редакцией: publishing@naukovedenie.ru 3 http://naukovedenie.ru 136EVN214 также значения эндогенной (выходной) переменной . Это позволяет оценить вероятность риска банкротства в последнем временном срезе по формуле логистической трансформации вероятности риска банкротства: . (2) При этом показатель экспоненты в нашем исследовании является нелинейной функцией от вектора факторов и аппроксимируется нейросетевой моделью [4]. Однако, в других временных срезах известны только векторы факторов , а значения эндогенной переменной и, соответственно, вероятности неизвестны, поскольку часть предприятий имеет промежуточную (неизвестную) стадию банкротства, которую по статистической модели вида (2), связывающей и Р, определить не представляется возможным. Причиной этого является деформация связи вида (2) с течением времени во временных срезах . В итоге столбцы (либо строки) данных во временных срезах оказываются неполными и обучение нейросетевой динамической модели оценки риска банкротства невозможно. В данной работе предлагается гибридный нейросетевой итерационный метод, суть которого основана на следующее идее. Будем считать, что нелинейная функциональная связь между и вектором в последнем временном срезе приближенно сохраняется и в других временных срезах . При таком допущении эндогенная переменная может быть восстановлена поочередно в каждом временном срезе подстановкой вектора в нейросетевую модель вида (4) (см. ниже). После этого данные становятся полными (комплектными), несущими в себе динамическую информационную через функции и , где временной аргумент является дискретным. Естественно, допущение о сохранении нелинейной зависимости во всех временных срезах вызывает определенную погрешность в оценке динамики риска банкротства, поэтому для уменьшения этой погрешности вводится специальный итерационный процесс исправления функции , в итоге которой мы получим динамическую модель оценки риска банкротства с непрерывным временем , что и является целью исследования в работе. 1. Постановка задачи Пусть известны неполные данные , где термин «неполноты» понимается в смысле отсутствия наблюдаемых значений эндогенной переменной в части временных срезов для некоторых предприятий. Здесь D гипотетически полные данные. Требуется построить логистическую динамическую нейросетевую модель оценки вероятности риска банкротства вида , (3) gN y )) ( ˆ exp( 1 1 gN g gN x Y P ) ( ˆ gN g x Y gN x N k tk , gk x gk y k gt Р х kt Yˆ x N t N k tk , 1 ,..., 2,1 , N k ygk gk x ) ( k g t x ) ( k g t y 1 ,..., 2,1 , N k tk ) ( ˆ gN g x Y )) ( ( ˆ t x Y g g T t ;0 D D kg y )) ), ( (ˆ exp( 1 1 ) ( t t x Y t P
Интернет-журнал «НАУКОВЕДЕНИЕ» Выпуск 2, март – апрель 2014 Опубликовать статью в журнале - http://publ.naukovedenie.ru Институт Государственного управления, права и инновационных технологий (ИГУПИТ) Связаться с редакцией: publishing@naukovedenie.ru 4 http://naukovedenie.ru 136EVN214 где показатель экспоненты восстанавливается по неполным данным с помощью нейросетевого отображения вида , (4) Здесь оператор нейросетевого отображения ; (5) где – пространства действительных чисел размерности n и 1 соответственно; W – матрица параметров (синаптических весов) нейросети. Поскольку требуемая нейросетевая модель (3) имеет четко выраженную прикладную направленность, то постановку задачи приблизим к реальным сложным условиям моделирования: 1) помимо оговоренной неполноты данных и возникающей при этом неопределенности в оценке динамической ситуации риска банкротства, будем считать, что данные сильно зашумлены (вплоть до сознательного искажения части данных, что может иметь место в бухгалтерской отчетности); 2) априорный вид закона распределения шумов неизвестен; 3) количество наблюдений в выделенном кластере предприятий ограничено несколькими сотнями. В литературе такие сложные условия моделирования относят классу задач с триадой «НЕ-факторов» (неполнота, неопределенность, неточность данных). 2. Описание алгоритма предлагаемого гибридного метода Алгоритм метода (Рис. 1) содержит два итерационных цикла: внутренних итераций с индексом k, , целью которых является восстановление эндогенной переменной во временных срезах ; внешних итераций с индексом , целью которых является введение в нейросетевую модель вида (4) информации о времени и, соответственно, получение нейросетевой динамической модели с непрерывным временем. Построение промежуточной квазистатической нейросетевой модели оценки риска банкротства (КСНСМ) Опишем алгоритм предлагаемого итерационного метода по шагам. Шаг 1. (k=1; S=1) Используя данные последнего временного среза (t=N), где известны вектор факторов и метки «банкрот» (РgN=1), «небанкрот» (РgN=0) для всех объектов и, соответственно значения аргумента экспоненты и , в блоке III строим статическую нейросетевую модель (СНСМ) III, например, типа многослойного персептрона (MLP) с алгоритмом обучения типа «обратного распространения ошибки» (BP) [4]. ) ), ( (ˆ t t x Y D ) , , ( ) , (ˆ t W x F t x Y ) 1 ( ) ( ˆ : R Y R x F n ) 1 ( ) 1 ( , R R n D D 1 ,..., 2,1 N k k gt y kt ,... 2,1 S gN х G g ,1 7 gN Y 7 gN Y
Интернет-журнал «НАУКОВЕДЕНИЕ» Выпуск 2, март – апрель 2014 Опубликовать статью в журнале - http://publ.naukovedenie.ru Институт Государственного управления, права и инновационных технологий (ИГУПИТ) Связаться с редакцией: publishing@naukovedenie.ru 5 http://naukovedenie.ru 136EVN214 На первом шаге внешних итераций (S=1) важно восстановить наиболее точно функциональную связь , скрытую в данных, в сложных условиях триады «НЕ-факторов», оговоренных во введении к статье. От качества НСМ на первом шаге будет на последующих шагах зависеть качество восстановления динамических закономерностей во временных срезах . Поэтому применим для построения КСНСМ модифицированныq метод вложенных математических моделей (МВММ) подробно описанный в [5, 6], который обеспечивает регуляризацию НСМ на основе байесовского подхода. Процедуры I.1-I.7, входящие в МВММ, по сути являются процедурами предрегуляризации исходных «сырых» данных, сформированных в блоке I.1. по стандартным данным бухгалтерской отчетности. Эти процедуры, кроме I.7, совпадают с аналогичными процедурами схемы МВММ из [5, Рис. 3.5]. Общей концепцией предобработки (предрегуляризации) данных в блоках I.1-I.7 является последовательное (сверху – вниз) сужение пространства переменных и, соответственно, повышение качества (однородности и информативности) данных. Сделаем некоторые комментарии к оригинальным процедурам I.4 и I.7, которые детально описаны в [5, 6]. Формирование систем показателей факторов в процедуре I.4 – это по существу формализованный оптимальный выбор по минимума критерия взвешенной суммы ошибок I и II рода идентификации объектов («банкрот» – «не банкрот»). – это множество анализируемых систем показателей, играющих роль априорных байесовских гипотез в ансамбле согласно квазибайесовскому методу регуляризации нейросетевой модели из [7]. Критерий определяется формулой: , (6) где – количество верно идентифицированных предприятий для данной зафиксированной байесовской мета-гипотезы с номером k; , – количество ошибок первого и второго рода соответственно при идентификации; , , – удельные веса показателей в (6), характеризующие их предпочтения, т.е. кофициенты Фишберна [8]: ; (7) n – количество ранжируемых показателей, входящих в критерий (6). Формулу (7) можно использовать в случае, если множество показателей , , упорядочено в порядке убывания их предпочтения . В блоке I.7 применяется нейросетевой аналог известного метода «включения» факторов в регрессионную модель [8]. Для выбранной в блоке I.4 системы факторов (мы использовали 16 показателей А. О. Недосекина [7, 9], разбитых на 4 группы: «рентабельность», «ликвидность и платежеспособность», «деловая активность», «финансовая устойчивость»). Вначале выбрано по одному фактору из каждой группы и построены вспомогательные НСМ вида (2), (5). Затем на каждом шаге итераций добавлялось по одному новому фактору, выбранному случайно. После полного перебора факторов по индексу фиксируется тот набор р*, который соответствует при тестировании модели условию . (8) ) (х Y ) , ( kt x P 1 ,..., 2,1 , N k tk Y X Hk K k H Hk K 3 2 2 1 1 * r N r N r N K Hk Hk Hk Hk * Hk N k N 1 Hk N 2 Hk N 1r 2r 3r n n i n ri )1 ( )1 ( 2 * Hk N 1 Hk N 2 Hk N ) ( 2 1 * Hk Hk Hk N N N 16 ,1 р ) min arg( , H K p p Hk p
Интернет-журнал «НАУКОВЕДЕНИЕ» Выпуск 2, март – апрель 2014 Опубликовать статью в журнале - http://publ.naukovedenie.ru Институт Государственного управления, права и инновационных технологий (ИГУПИТ) Связаться с редакцией: publishing@naukovedenie.ru 6 http://naukovedenie.ru 136EVN214 Нам удалось сократить размерность факторного пространства с 16 до 6 без заметного снижения критерия (8), т.е. процента правильной идентификации объектов по банкротству. В блоке III подмодели II проводится кластеризация предприятий в пространстве кортежей по усеченному в блоке I.7 вектору факторов . Целью кластеризации является дальнейшее углубление степени однородности данных в аспекте учета различия динамики вероятности банкротства в разных кластерах (см. ниже, Рис. 2). «Различие» состоит в том, что значения факторов в последнем временном срезе предопределяют восстанавливаемые значения в КСНСМ IV и динамической модели V. Для кластеризации можно использовать нейросети Кохонена [10], либо более простой метод k-средних [11]. Мы выделяли 3 кластера и дальнейшее построение моделей КСНСМ с дискретным временем и ДНСМ с непрерывным временем осуществлялось отдельно для каждого кластера. В блоке III.1 осуществляется регуляризация СНСМ оценки риска банкротства на байесовском ансамбле нейросетей на основе МВММ, подробно описанного в [5, 6]. Качество регуляризированной модели определяется критерием , (9) где m – номер кластера; р* – номер наилучшего набора факторов; Н* – наилучшая система факторов (мета-гипотеза); ξ – экспертно задаваемое число. В итоге шага 1 в блоке III.2 для фиксированного времени в последнем временном срезе мы получаем статическую логистическую нейросетевую модель оценки риска банкротства (СЛНСМ) (2), (5): , (10) где – оператор нейросетевого отображения [10]. Квазистатический нейросетевой метод оценки риска банкротства (КСНСМ) с дискретным временем Шаг 2. (k=0,1,2,…,N-1; S=1). Далее в блоке IV будем восстанавливать эндогенную переменную в каждом временном срезе во внутреннем итерационном цикле (k=0,1,2,…,N-1), используя статическую нейросетевую модель (2), (10), полученную на шаге 1, для каждого g-го предприятия. Итогом этой процедуры является множество вероятностей риска банкротства во временных срезах: ; (11) . (12) Замечание 1. Модель (4, 5), (11), (12) – это уже квазистатическая нейросетевая модель оценки риска банкротства с логистической трансформацией вероятности (ЛКСНСМ) и дискретным временем . Здесь уже можно приближенно оценивать стадии развивающегося процесса банкротства по вероятностям во временных срезах. Однако, динамическая информация в моменты времени между срезами отсутствует. G g x y gk gk ,1 , , gN gN x x ) (t P jx T tN k gt yˆ 1 ,1 , N k tk T ;0 t 3,1 , | max , m H K p Hk m T tk ) , ( ) (ˆ W x F x Y ) ( F gk y 1 ,..., 2,1 ; ))) ( ( ˆ exp( 1 1 )) ( ( ˆ N k t x Y t x Y P k g k g g var ; ,..., , ) ( 2 1 1 g P P P t P N gt gt gt N k k k g kt
Интернет-журнал «НАУКОВЕДЕНИЕ» Выпуск 2, март – апрель 2014 Опубликовать статью в журнале - http://publ.naukovedenie.ru Институт Государственного управления, права и инновационных технологий (ИГУПИТ) Связаться с редакцией: publishing@naukovedenie.ru 7 http://naukovedenie.ru 136EVN214 На языке функционального анализа модель (5), (11), (12) представляет собой композицию двух нелинейных операторов: ; ; , (13) где F – оператор нейросетевого отображения вида (4)-(5); А – оператор логистической трансформации вероятности вида (11); – конечномерное пространство дискретных функций размерности N. Динамический нейросетевой метод (ДНСМ) оценки вероятности риска банкротства с непрерывным временем Шаг 3. (k=1,2,…,N-1; S=2). На шаге 3 в блоке V алгоритма мы переходим к внешним итерациям введения в динамическую модель непрерывного времени . Для этого в каждой кластерной НСМ в состав вектора факторов введем в качестве независимого нового фактора – время t: . (14) Используя восстановленные данные, т.е. кортежи , (15) обучаем заново и тестируем нейросеть: , (16) где в нейросетевой модели время t входит явно и является непрерывным. Значит модель (3), (16) можно в полной мере считать динамической, поскольку при обучении НСМ учитывается, что нелинейная зависимость (3) «плывет» во времени. Причем можно получить информацию о вероятности риска банкротства, как во временных срезах, так и в любой точке между ними. Следовательно, появляется возможность уточнения восстанавливаемых значений эндогенных переменных в кортежах: , (17) где синаптические веса берутся из предыдущего шага внешних итераций (S=1). Шаг 4. (k=1,2,…,N-1; S=3). Заново обучаем ДНСМ с учетом новых восстановленных данных, т.е. реализуем шаги 2, 3 и т.д. Критерий сходимости внешнего итерационного процесса по индексу S восстановления эндогенных переменных и уточнения ДНСМ выбираем в виде: , (18) Замечание 2. Вычислительный процесс построения ДНСМ является довольно трудоемким, поскольку восстанавливать приходится эндогенные переменные на шагах 3,4,… для всех предприятий, входящих в кластер m и во всех временных срезах. Это естественная плата за переход от квазистатической нейросетевой модели к динамической для ) ( ) ( ) ( N k n M t P R x F A 1 ,1 N k ) (N M T ;0 t x t x x x x x x n n j 1 2 1 , ,..., ,..., , N N k t x y k gk gk ,1 ,..., 2,1 , , , ) , ), ( ( ) ), ( (ˆ W t t x F t t x Y 1 ,..., 2,1 ), , ), ( ( ) 1 ( ) 2 ( N k W t t x F y k gk ) 1 ( W gk yˆ ,... 4,3 ;1 ,1 ; ,1 ; ˆ ˆ ˆ max max ) ( ) 1 ( ) ( S N k G g y y y J S gk S gk S gk k g ) (S gk y
Интернет-журнал «НАУКОВЕДЕНИЕ» Выпуск 2, март – апрель 2014 Опубликовать статью в журнале - http://publ.naukovedenie.ru Институт Государственного управления, права и инновационных технологий (ИГУПИТ) Связаться с редакцией: publishing@naukovedenie.ru 8 http://naukovedenie.ru 136EVN214 данного сектора экономики и данного региона (страны). Зато последующее использование на практике ДНСМ довольно просто – оно сводится к подстановке на входе обученной и верифицированной нейросети, единой для всего кластера модели вектора факторов для анализируемого g-го объекта в интересующих момент времени t. Замечание 3. Основная ценность модели банкротства, получаемой с помощью ДНСМ – это возможность получения качественного прогноза банкротства с информацией о стадиях его развития. 3. Модификация динамического нейросетевого метода оценки риска банкротства (МДНСМ) На практике встречаются экономические объекты с большой инерцией. В таких объектах при исследовании динамики риска банкротства важно учесть «медленное время» с помощью лаговых переменных разного типа. Авторы статьи предлагают, аналогично [12], ввести в состав вектора факторов также лаговые переменные вида: . (19) Эффективность такого приема можно оценить только путем вычислительных экспериментов по критерию скорости сходимости итерационного процесса (18). 4. Количественные оценки построения динамической модели банкротств Использовались реальные данные для строительных организаций из [7]. Этап 1 (Итерация 0). Был обучен ансамбль из десяти сетей на выборке из 136 наблюдений для t=5 (последний временной срез). Результаты тестирования и структура сетей представлены в таблицах 1 и 2. Таблица 1 Структура байесовского ансамбля № сети Количество скрытых слоев Оптимальное количество нейронов в скрытых слоях Вид активационной функции в скрытых слоях НСМ1 1 7 Гиперболический тангенс НСМ2 1 6 Сигмоид НСМ3 2 14, 9 Гиперболический тангенс в обоих слоях НСМ4 2 14, 11 Гиперболический тангенс в первом слое, сигмоид – во втором НСМ5 2 8, 13 Сигмоид в первом слое, гиперболический тангенс – во втором НСМ6 2 13, 12 Сигмоид в обоих слоях НСМ7 3 14, 13, 14 Гиперболический тангенс в первом и третьем слое, сигмоид – во втором НСМ8 3 8, 14, 12 Гиперболический тангенс во всех слоях НСМ9 3 12, 14, 10 Гиперболический тангенс во всех слоях НСМ10 3 14, 13, 15 Гиперболический тангенс во всех слоях ) (t x х 2 1 3 2 2 1 1 ; ; t t t t t t t P P z P z P z
Интернет-журнал «НАУКОВЕДЕНИЕ» Выпуск 2, март – апрель 2014 Опубликовать статью в журнале - http://publ.naukovedenie.ru Институт Государственного управления, права и инновационных технологий (ИГУПИТ) Связаться с редакцией: publishing@naukovedenie.ru 9 http://naukovedenie.ru 136EVN214 Рис. 1. Логическая схема алгоритма динамического метода оценки вероятности риска банкротства предприятий (начало)
Интернет-журнал «НАУКОВЕДЕНИЕ» Выпуск 2, март – апрель 2014 Опубликовать статью в журнале - http://publ.naukovedenie.ru Институт Государственного управления, права и инновационных технологий (ИГУПИТ) Связаться с редакцией: publishing@naukovedenie.ru 10 http://naukovedenie.ru 136EVN214 Рис. 1. Логическая схема алгоритма динамического метода оценки вероятности риска банкротства предприятий (продолжение)