Адаптивные нейронные сети
Как было показано в предыдущем разделе, закономерности, которые кроются в цифровой информации, на практике используются не полностью. Доля переработки исходных данных о предприятиях, которые содержатся в финансовых отчетах и базах данных, в практически значимые знания невелика, так как арсенал классической статистики не позволяет решать такую задачу. Традиционные статистические методы способны обнаруживать регулярности, тенденции и структурные связи в совокупностях предварительно не обработанных многомерных данных. Однако лишь немногие из них позволяют непосредственно визуализировать связи, существующие между их элементами. При этом техника такой визуализации не свободна от недостатков.
Однако существуют методы, которые дают возможность закономерностям, скрытым в массивах данных, проявляются визуально в автоматическом режиме. Данные как бы самостоятельно упорядочиваются, располагаясь в двумерном пространстве в соответствии с их внутренним устройством. Посредством процесса, именуемого самоорганизацией, такие методы образуют топологическое представление исходных данных из элементов, получаемых на выходе. Наличие связей становится очевидным в результате нелинейного проецирования многомерного пространства данных на двумерную плоскость выходных данных. Программно-математической основой этих методов являются самоорганизующиеся нейронные сети. Впервые подобный метод был предложен в 1982 г. под названием метода самоорганизующихся карт. В настоящее время эти методы уже доказали свою высокую эффективность в области экономики и финансов.
Искусственные нейронные сети являются аппаратом из области нейрокомпьютинга (neural computing) быстро развивающейся в последнее время области вычислительных технологий, стимулированной исследованиями мозга. Вычислительные операции в таких сетях выполняются большим числом сравнительно простых процессорных элементов (processing element). Структура сети (network) тождественна математически определенной структуре вычислительной системы, в которой все операции выполняются в определенных узлах, а поток информации отображается направленными ребрами графа. Каждый узел (или нейрон . neuron) сети представлен процессорным элементом . Нейроно подобной ячейкой, которая совместно со многими другими процессорными элементами образует нейронную вычислительную сеть.
Аналогом такого узла в физиологической нервной системе является нервная клетка мозга. В общем случае искусственная нейронная сеть представляет собой адаптивную нелинейную динамическую систему. Посредством равновесных состояний такой сети можно решать математические или вычислительные задачи. Процесс их решения получил название нейросетевых вычислений.
Нейронные сети представляют собой совокупность математических методов, которые могут быть использованы для обработки информации, прогнозирования и кластеризации. Математически их можно представить как нелинейные, многослойные и параллельные методы регрессии. Иначе говоря, нейросетевое моделирование подобно проведению линии, плоскости или гиперплоскости через определенный набор информационных точек. Такой набор (в данном случае набор финансово-экономических параметров эмитента) тождественен входному набору нейросети. Рассчитанная сетью гиперплоскость тождественна выходным данным нейросети. Линию, плоскость или гиперплоскость можно с наилучшим приближением провести через любой набор данных и по выбору исследователя определить взаимосвязи, которые могут существовать между входами и выходами нейросети. Сеть можно также подстроить для представления многомерных данных в меньшей размерности.
Существует два класса нейронных сетей:
сети, обучаемые с учителем;
сети, обучаемые без учителя.
Нейронные сети, обучаемые с учителем, представляют собой средства для извлечения из набора данных информации о взаимосвязях между входами и выходами нейросети. Эти взаимосвязи могут быть переведены в математические уравнения, которые можно использовать для прогнозирования или выработки управленческих решений. «Учителем» в данном случае является набор параметров, который исследователь помещает на выходе сети. На вход сети при этом подается соответствующий данному выходу входной набор данных. Сеть обучается устанавливать взаимоотношения между заданной исходной информацией и результатами в ходе адаптивного итерационного процесса. Иначе говоря, структура сети по определенным алгоритмам подстраивается таким образом, чтобы минимизировать критерии расхождения входных и выходных параметров. Данный процесс повторяется многократно с использованием новых пар наборов входных и выходных данных. В результате структура сети «запоминает» сходные признаки всех этих наборов.
Сеть, которую однажды уже обучили таким образом, может быть использована для обработки входных данных, которые ей ранее никогда не предъявлялись. Когда такие данные подаются на вход обученной сети, на ее выходе появляются параметры, сформированные с использованием всех сходных признаков обработанных ранее сетью данных. Таким образом, в нейросетевых методиках, предполагающих обучение с учителем, для нахождения образа или соотношения между данными требуется, чтобы один или более выходов были точно заданы вместе с одним или более входами.
Алгоритм работы сети, обучаемые без учителя, основывается на соревновательном обучении. В этом случае тестовые выходные данные не используются. Алгоритм предполагает такое поведение нейронов сети, что при каждой подаче очередного набора данных на вход они как бы «соревнуются» друг с другом на наилучшее соответствие входному набору по выбранным критериям. В результате соревнования определяется нейрон-победитель, после чего структура сети подвергается коррекции. Коррекция начинается с нейрона-победителя и производится в направлении увеличения его соответствия входному сигналу. После этого коррекция переходит на нейроны, непосредственно примыкающие к нейрону-победителю и далее. При этом по мере удаления от нейрона-победителя интенсивность коррекции постепенно снижается до нуля.
Нейроны сети, обучаемой без учителя, как правило, образуют двумерную решетку. Алгоритм обеспечивает сохранение топологии отображения из пространства большой размерности (представленного совокупностью наборов входных данных) в элементы данной двумерной решетки.
Таким образом, это отображение является отображением пространства большой размерности на плоскость. Свойство сохранения топологии означает, что алгоритм распределяет сходные векторы входных данных по одним и тем же нейронам, т.е. точки, расположенные в пространстве входов близко друг к другу, будут отображаться на близко расположенные выходные элементы-нейроны.
Данный алгоритм анализирует входные данные и показывает выходную информацию как бы на плоской индикаторной панели с помощью активизируемых нейронов.
Это позволяет обучить нейронную сеть узнавать или находить взаимосвязи между входами и выходами, либо организовывать входные данные таким образом, чтобы выявлять в них ранее неизвестные образы или структуры.
Обозначим класс самоорганизующихся нейронных сетей, обучаемых без учителя, термином адаптивные нейронные сети (АНС). Рассмотрим подробнее основные свойства таких сетей и покажем, что они наилучшим образом позволяют решать задачи, сформулированные в соответствующем разделе монографии.
Важным достоинством метода АНС является то, что он представляет собой численный, а не символьный метод обработки данных. В процессе вычислений многие расчеты обрабатываются соревновательно. Это дает возможность широко использовать параллельную обработку данных в компьютерах (parallel processing). Одной из уникальных особенностей АНС является то, что она предоставляет внутренне присущие ей точные и простые механизмы для разделения вычислительной задачи на субъединицы. Такая внутренне присущая параллельность позволяет проводить вычисления с помощью высокопроизводительной архитектуры с высокой степенью параллельности.
Немаловажно то, что АНС относится к классу методов, предполагающих обучение без внешнего вмешательства, что обеспечивает повышение объективности результатов. Обучение без учителя дает возможность обнаруживать во входных наборах данных неизвестные ранее структуры или закономерности, что отражает способность АНС к обобщению (generalization) на основе входных примеров. Это свойство позволяют обобщать большие наборы многомерных данных, которыми являются финансово-экономические показатели предприятий, выявлять и демонстрировать содержащиеся в них структуры, а также обнаруживать новые образы и взаимосвязи в таких наборах данных.
Свойство обобщения можно также интерпретировать как способность вычислительной нейросистемы производить обработку входных данных таким образом, чтобы получить ощутимый отклик на не встречавшийся ранее воздействие. Это означает, что подобные нейронные сети могут узнавать или характеризовать входные данные, с которыми они никогда прежде не имели дело.
Новый вектор входных данных соотносится с теми выходными элементами, на которые он отображается. При этом в формировании отклика принимает участие вся та информация, которая была внесена в сетевую структуру в ходе предшествующего обучения.
Достоинством метода АНС служит также то, что данный метод является непараметрическим, т.е. не требует априорных предположений о форме распределения данных. В частности, он не требует априорных предположений о виде функционала процесса, формирующего структуру входных данных, и распределения, характеризующего динамику изменения во времени финансово экономических показателей предприятий. Алгоритм АНС может быть использован для того, чтобы получить картину распределения структуры входных данных и ее изменения с течением времени на материале набора исторических данных. Прибегнув затем к численному моделированию (например, методом Монте-Карло), можно получить прогноз изменения структуры входных параметров в долгосрочной перспективе.
В сущности, все нейронные сети являются мощным инструментом прогнозирования. Заложенные в них генетические алгоритмы, эволюционируя естественным путем, позволяют выявить правила и стратегии, преследующие множественные цели. Таким образом, при введении одного или большего числа ограничений можно оптимизировать систему в любом направлении ее развития, что позволяет осуществить направленный прогноз. Поэтому АНС могут служить хорошим инструментом для изучения динамики процессов, характеризуемых потоками входных данных. Причина этого кроется в том, что АНС основаны на нейросетевой технологии, позволяющей анализировать нелинейности, сохраняя топологию и распределение данных, что представляет существенную важность для прогнозирования. Экономическая деятельность предприятий основана на планировании (если не стратегическом, то хотя бы краткосрочном). Поэтому исторические данные по финансово-экономическим показателям обладают свойством персистентности (persistence), математически трактуемым как свойство временного ряда следовать тенденции. Если определенная тенденция увеличивалась за предыдущий период, имеется ненулевая вероятность того, что она продолжит увеличение в течение последующего периода. Предварительный анализ показывает, что показатель Хурста (Hurst exponent, H) для основных параметров финансовой отчетности большинства российских предприятий в поквартальном измерении соответствует требованиям для персистентных рядов или рядов с тенденцией к усилению (0,5 < H < 1,0).
Среди положительных качеств метода АНС следует отметить то, что он обеспечивает высокую наглядность результатов. Алгоритм АНС одновременно выполняет две задачи: проецирование и кластеризацию, обеспечивая наглядное представление многомерных входных данных на плоскости выходных данных в виде кластеров. Различные нейроны с помощью метода АНС автоматически окрашиваются в соответствии с активностью воздействия на них входных сигналов. Сходные сигналы вызывают активность одних и тех же нейронов. Таким образом, нейроны группируются в компактные кластеры, характеризующейся близкой интенсивностью окраски. Это изображение четко проступает на плоскости выходных данных АНС. Особую важность представляют топологические свойства результирующей картины, так как они позволяют находить в непосредственной окрестности нейрона, соответствующего тому или иному набору входных данных, другие наборы, близкие ему по своим характеристикам.
Алгоритм АНС обеспечивает также возможность визуализации различных входных показателей из всех обработанных наборов. В общем случае каждый балансовый показатель на плоскости выходных данных выделяется отдельным цветом, а различия в его значениях передаются оттенками этого цвета. Ячейки плоскости с высокими значениями того или иного показателя оказываются окрашенными более интенсивно.
Организованная подобным образом АНС обладает свойством интерактивности. На плоскости выходных данных можно получить распределение любого признака входного массива данных. Она может проиллюстрировать даже динамику сложного процесса путем демонстрации траектории любого балансового показателя на плоскости.
Такие возможности реализованы в программных продуктах, основанных на методе самоорганизующихся сетей.
Применение этих продуктов не требует специальной математической подготовки.
Наконец, метод АНС демонстрирует высокую работоспособность в условиях неполноты данных, что резко выделяет его из остальных известных методов анализа структурированных наборов данных. Иначе говоря, на вход АНС могут подаваться наборы финансово-экономических показателей предприятий с существенными пропусками данных внутри набора. Алгоритм АНС не только позволяет успешно обрабатывать такие данные, но и восстанавливать некоторые отсутствующие значения на основе информации, полученной ранее при обучении АНС.
Объяснением этого является присущая нейронным сетям «стойкость к неисправностям» (fault tolerance) . свойство, позволяющее системе функционировать и ухудшать работу плавно при отключении малого числа обрабатывающих элементов. В совокупности с описанным выше свойством обобщения эта особенность АНС обеспечивает ее повышенную устойчивость к информационным помехам. Иначе говоря, ошибки операторов при заполнении матриц финансово-экономических показателей предприятий не приводят в каждом таком случае к получению резко искаженных результатов, а в значительной мере элиминируются обученной сетью.
Все эти свойства делают АНС наиболее приемлемым инструментом для анализа финансовой отчетности предприятий-эмитентов и весьма полезным элементом системы информационного обеспечения принятия решений акционеров. С помощью АНС можно выявить более тонкие особенности поведения компаний, чем при использовании некоторых более традиционных аналитических средств, подобных, например, линейному дискриминантному анализу. Новые образы и связи могут быть использованы для прогнозирования деятельности эмитентов, определения рыночных цен пакетов акций, принятия управленческих решений об инвестициях в ценные бумаги, управления рисками и инвестиционным портфелем, выявления перспективных эмитентов и решения многих других задач.
Финансовые и экономические приложения с использованием самоорганизующихся сетей показывают, что конкретных процедур либо оптимальных методов их применения, которые годились бы для всех областей применения, не существует. Подобно разработке других нейросетевых моделей, создание самоорганизующихся сетей является пока еще, скорее, искусством, чем наукой.
Поэтому их можно использовать только тогда, когда анализируемые данные хорошо понятны для исследователя.
Профессиональная экспертная оценка выходных результатов является довольно существенным элементом анализа при помощи самоорганизующихся сетей и играет в нем важнейшую роль.
Использование АНС для анализа финансовых отчетов и другой информации об эмитентах позволяет обнаруживать структуры в больших наборах данных и представлять данные большой размерности в виде двумерных изображений. Это дает возможность с высокой эффективностью решать задачу выявления важных закономерностей в экономической деятельности эмитентов и интерпретировать их с точки зрения интересов инвесторов. С помощью АНС многомерные данные, публикуемые эмитентами, могут быть преобразованы в наглядные плоские картины, доступные восприятию людей, принимающих решения.
Исследование паттерн (образов) в структуре входных данных позволяет анализировать особенности экономической стратегии эмитентов. Диагностика финансового положения компаний на основании визуального исследования становится более объективной и оперативной.
Кроме этого использование АНС позволяет значительно повысить качество традиционно публикуемой эмитентами информации, предоставляя лучшую основу для выбора, сравнения и ранжирования данных.
Методы АНС можно использовать для демонстрации четких различий и структурных особенностей данных по лучшим предприятиям. При этом в качестве входных данных следует использовать балансовые показатели предприятий, коэффициенты эффективности, оценки рисков, опыт экспертов в области финансового анализа деятельности компаний, а также данные о котировках ценных бумаг на организованных рынках.
АНС позволяют упростить классификацию предприятий и создать таблицы для обеспечения принятия решений, более информативные по сравнению с простыми ранжированными списками, построенными исходя из единичных и множественных критериев. Двумерное представление финансовой информации является более мощным средством, чем обычное ранжирование, оно дает гораздо больше информации для инвесторов и облегчает выявление неравномерностей в больших массивах сложных финансовых данных. АНС позволяют провести дифференциацию между близкими по характеристикам предприятиями и определить основные признаки каждого кластера или группы кластеров.
Метод АНС повышает эффективность принятия управленческих решений. Доказано [1], что благодаря возможности кластеризации эмитентов с похожими характеристиками, доходность портфеля акций, составленного на основе этого метода, выше, чем у портфеля, сформированного исходя из единственного критерия максимизации доходности при приемлемом риске или с помощью других классических стратегий. Таким образом, использование АНС открывает новые возможности для формирования оптимальной стратегии управления большими портфелями ценных бумаг.
Методика АНС позволяет финансовым и экономическим данным говорить самим за себя. Например, когда на вход сети подаются финансовые данные о группе компаний, на плоскости выходных параметров они размещаются таким образом, что компании со сходными финансовыми характеристиками оказываются расположенными близко друг к другу. Группировка компаний согласно сходству финансово-экономической структуры позволяет решать задачу выявления стратегических групп. Упорядочивание выборочных входных данных по таким группам дает возможность определить правила или описать групповые характеристики. При этом возникают новые данные . параметры порядка (order parameter) . переменные, которые в нелинейных динамических системах интегрируют индивидуальные переменные, влияющие на систему. При определении границ групп в дополнениек АНС полезно использовать кластерный анализ. Он позволяет подтвердить и детализировать результаты, полученные методом АНС.
АНС можно использовать для диагностики финансового состояния компаний, принадлежащих к одному и тому же сектору экономики с тем, чтобы определить стратегию каждой конкретной компании по отношению к сектору экономики, в котором она действует. Кроме этого можно сравнивать финансовые и экономические показатели различных стратегических групп компаний.
Выходная информация АНС способна хорошо иллюстрировать процесс эволюции тенденций в деятельности корпоративных предприятий с течением времени. Кроме того, с помощью АНС можно провести сравнение различных компаний по отдельным отраслям. Распределение выходных данных наглядно отображает сходства и различия между компаниями, что позволяет сравнивать финансовое положение выбранной компании с положением конкурентов и создавать секториальные карты.
Благодаря методу АНС, использующему многомерные множества входных данных, можно проследить относительную изменчивость показателей отдельных компаний по отношению к изменчивости групп. Это позволяет решать задачу выявления квазикоммерческих компаний и определять их отличительные признаки. В общем случае распределение различных компаний в пространстве признаков характеризуется нерегулярностью, наличием нелинейностей и неоднородностей. Однако АНС позволяет сделать более наглядными сложные ситуации с помощью соответствующих друг другу компонент, выделяя при этом множество нестандартных случаев. Таким образом, сетью выявляются нетипичные компании и компоненты.
Метод АНС позволяет значительно усовершенствовать процесс создания оценочных критериев и снизить затраты на их поддержание и обновление. Это дает возможность использовать его при решении задачи определения минимального набора показателей, с достаточной надежностью характеризующих финансово-экономическое состояние предприятий. Данный подход целесообразно иллюстрировать визуальным представлением информации по отдельным компаниям, построением эталонных тестов и выведением наиболее приемлемых показателей для сравнения эффективности инвестирования в ценные бумаги различных эмитентов.
В ходе анализа инвестиций в ценные бумаги предприятий с помощью АНС особого внимания заслуживает процесс масштабирования компонент для выделения отдельных аспектов информации. Для изменения отдельных компонент либо акцентирования внимания на оцениваемых свойствах можно использовать анализ чувствительности. Данный анализ позволяет решать задачу оценки относительной важности контролируемых показателей.
Важность каждого показателя тем выше, чем сильнее меняется выходная картина при проведении эталонного масштабирования. Информацию о том, каким образом различные входные переменные вносят вклад в отображение предприятий на плоскости выходных параметров, можно получить также, представив
Преимущество графического представления АНС состоит в том, что оно дает наглядное разделение компаний на два класса: потенциальных банкротов и платежеспособных. Подавая на вход обученной сети набор данных новой компании, необходимо лишь посмотреть на плоскость выходных параметров и определить, в какой зоне оказались наиболее активные нейроны. Если они располагаются в зоне кризиса . то компания находится в критической ситуации, а если в платежеспособной области . то она платежеспособна. Использование АНС в системе информационного обеспечения принятия решений позволяет с легкостью оценивать платежеспособность предприятия, вводя лишь значения финансовых показателей. Модель АНС может показать, к какому кластеру относится компания и для каких еще компаний характерны подобные показатели. Это позволяет выявить наиболее яркие финансовые признаки потенциальных банкротов.
Однако практика показывает, что массив данных за один год не позволяет определить признаки банкротства с высокой надежностью. Поэтому с помощью карты платежеспособности необходимо пронаблюдать динамику развития анализируемой компании, вводя финансовую информацию за разные годы. Если некая компания в какой-то период времени оказывается в зоне банкротства, ее необходимо рассмотреть более тщательно, поскольку финансовая структура этой компании не отличается от финансовой структуры других компаний, разорившихся в прошлом. Если же она стабильно находится в области благополучных компаний, дополнительное рассмотрение не требуется. Особое внимание необходимо уделять компаниям, находящимся в пограничной области с зонами банкротства и платежеспособности. Преимуществом представления информации с помощью АНС является то, что в этом случае данная область совершенно очевидна.
Однако, учитывая важность этих зон, границы их должны определяться с максимально возможной точностью.
Проводимый с помощью АНС исследовательский анализ и извлечение данных (data mining) могут быть использованы для обнаружения скрытых знаний (knowledge discovery) в больших базах данных, что позволяет решать задачу преобразования скрытого знания в явное. В общем случае это представляет собой целый интерактивный процесс выявления в данных неизвестных ранее паттернов или структур. В этом контексте под знаниями понимаются взаимосвязи между элементами данных и паттернами в наборах данных, а извлечение знаний определяется как нетривиальное обнаружение в данных первоначально неизвестных и потенциально полезных знаний. На практике под этим подразумевается поиск структурных паттернов в данных по внешне похожим предприятиям. Основной процесс исследовательского анализа данных и извлечения знаний состоит из множества шагов, начиная с формулировки целей и заканчивая оценкой результатов. Он может включать в себя петлю обратной связи, что означает переформулирование целей на основе полученных результатов. В зависимости от целей этого процесса наряду с АНС широко используются алгоритмы распознавания образов, машинное обучение и многомерный статистический анализ. В целом же обнаружение знаний является междисциплинарный процессом, в ходе которого могут также использоваться классическая статистика, программирование, технологии баз данных и экспертные системы.
Содержание раздела