d9e5a92d

Методы анализа больших систем, планиров. экспериментов



Еще в начале рассмотрения вопросов о целях и методах системного анализа мы обнаружили ситуации, в которых нет возможности описать элемент системы, подсистему и систему в целом аналитически, используя системы уравнений или хотя бы неравенств.
Иными словами — мы не всегда можем построить чисто математическую модель на любом уровне — элемента системы, подсистемы или системы в целом.
Такие системы иногда очень метко называют "плохо организованными" или "слабо структурированными".
Так уж сложилось, что в течение почти 200 лет после Ньютона в науке считалось незыблемым положение о возможности "чистого" или однофакторного эксперимента. Предполагалось, что для выяснения зависимости величины Y=f(X) даже при очевидной зависимости Y от целого ряда других переменных всегда можно стабилизировать все переменные, кроме X, и найти "личное" влияние X на Y.
Лишь сравнительно недавно (см. работы В. В. Налимова) плохо организованные или, как их еще называют — большие системы вполне "законно" стали считаться особой средой, в которой неизвестными являются не то что связи внутри системы, но и самые элементарные процессы.
Анализ таких систем (в первую очередь социальных, а значит и экономических) возможен при единственном, научно обоснованном подходе — признании скрытых, неизвестных нам причин и законов процессов. Часто такие причины называют латентными факторами, а особые свойства процессов — латентными признаками.

Обнаружилась и считается также общепризнанной возможность анализа таких систем с использованием двух, принципиально различных подходов или методов.

· Первый из них может быть назван методом многомерного статистического анализа. Этот метод был обоснован и применен видным английским статистиком Р.Фишером в 20..30 годы этого столетия. Дальнейшее развитие многомерной математической статистики как науки и как основы многих практических приложений считается причинно связанным с появлением и совершенствованием компьютерной техники. Если в 30-е годы, при ручной обработке данных удавалось решать задачи с учетом 2..3 независимых переменных, то 1965 году решались задачи с 6 переменными, а к 70..80 годам их число уже приближалось к 100.

· Второй метод принято называть кибернетическим или "винеровским", связывая его название с отцом кибернетики Н.Винером. Краткая сущность этого метода — чисто логический анализ процесса управления большими системами. Рождение этого метода было вполне естественным — коль скоро мы признаем существование плохо организованных систем, то логично ставить вопрос о поиске методов и средств управления ими. Совершенно нелепо ставить вопрос о распределении токов в электрической цепи — это процессы в хорошо организованной (законами природы) системе.

Интересно, что оба метода, несмотря на совершенное различие между собой, могут применяться и с успехом применяются при системном анализе одних и тех же систем.
Так, например, интеллектуальная деятельность человека изучается "фишеровским" методом — многие психологи, как иронически замечает В.В.Налимов, "уверены, что им удастся разобраться в результатах многочисленных тестовых испытаний ".
С другой стороны, построение т.н. систем искусственного интеллекта представляет собой попытки создания компьютерных программ, имитирующих поведение человека в области умственной деятельности, т.е. применение "винеровского" метода.
Нетрудно понять, что экономические системы, скорее всего, следует отнести именно к плохо организованным — прежде всего, потому, что одним из видов элементов в них является человек. А раз так, то неудивительно, что при системном анализе в экономике потребуется "натурный" эксперимент.
В простейшем случае речь может идти о некотором элементе экономической системы, о котором нам известны лишь внешние воздействия (что нужно для нормального функционирования элемента) и выходные его реакции (что должен "делать" этот элемент).
В каком то смысле спасительной является идея рассмотрения такого элемента как "черного ящика". Используя эту идею, мы признаемся, что не в состоянии проследить процессы внутри элемента и надеемся построить его модель без таких знаний.
Напомним классический пример — незнание процессов пищеварения в организме человека не мешает нам организовывать свое питание по "входу" (потребляемые продукты, режим питания и т. д.) с учетом "выходных" показателей (веса тела, самочувствия и других).
Так вот, наши намерения вполне конкретны в части "что делать" — мы собираемся подавать на вход элемента разные внешние, управляющие воздействия и измерять его реакции на эти воздействия.
Теперь надо столь же четко решить — а зачем мы это будем делать, что мы надеемся получить. Вопрос этот непростой — очень редко можно позволить себе просто удовлетворить свою любознательность. Как правило, эксперименты над реальной экономической системой являются вынужденной процедурой, связанной с определенными затратами на сам эксперимент и, кроме того, с риском непоправимых отрицательных последствий.

Теоретическое обоснование и методика действий в таких ситуациях составляют предмет особой отрасли кибернетики — теории планирования эксперимента.



Договоримся о терминологии:

· все, что подается на вход элемента, будем называть управляющими воздействиями или просто воздействиями;

· все, что получается на выходе элемента, будем называть реакциями;

· если мы можем выделить в системе (или подсистеме) несколько в некотором смысле однотипных элементов, то их совокупность будем называть блоком;

· содержательное описание своих действий по отношению к элементам блока будем называть планом эксперимента.


Очень важно понять цель планируемого эксперимента. В конце концов, мы можем и не получить никакой информации о сущности процессов в цепочке "вход-выход" в самом элементе.
Но если мы обнаружим полезность некоторых, доступных нам воздействий на элемент и убедимся в надежности полученных результатов, то достигнем главной цели эксперимента — отыскания опти-мальной стратегии управления элементом. Нетрудно сообразить, что понятие "управляющее воздействие" очень широко — от самых обычных приказов до подключения к элементу источников энергетического или информационного "питания".
Оказывается, что уже само составление плана эксперимента требует определенных познаний и некоторой квалификации.

Опыт доказывает целесообразность включения в план следующих четырех компонентов:

· Описание множества стратегий управления, из которого мы надеемся выбрать наилучшую.

· Спецификацию или детальное сравнительное описание элементов блока.

· Правила размещения стратегий на блоке элементов.

· Спецификацию выходных данных, позволяющих оценивать эффективность элементов.

Внимательное рассмотрение компонентов плана эксперимента позволяет заметить, что для его реализации требуются знания в раз-личных областях науки, даже если речь идет об экономической системе — той области, в которой вы приобретаете профессиональную подготовку. Так, при выборе управляющих воздействий не обойтись без минимальных знаний в области технологии (не всегда это — чистая экономика), очень часто нужны знания в области юридических законов, экологии. Для реализации третьего компонента совершенно необходимы знания в области математической статистики, так как при-ходится использовать понятия распределений случайных величин, их математических ожиданий и дисперсий. Вполне могут возникнуть ситуации, требующие применения непараметрических методов статистики.
Для демонстрации трудностей составления плана эксперимента и необходимости понимания методов использования результатов эксперимента, рассмотрим простейший пример.
Пусть мы занимаемся системным анализом фирмы, осуществляющей торговлю с помощью сети "фирменных" магазинов и имеем возможность наблюдать один и тот же выходной показатель элемента такой системы (например, дневную выручку магазина фирмы).
Естественным является стремление найти способ повышения этого показателя, а если таких способов окажется несколько — выбрать наилучший. Предположим, что в соответствии с первым пунктом правил планирования эксперимента, мы решили испытать четыре стратегии управления магазинами. Коль скоро такое решение принято, то неразумно ограничить эксперимент одним элементом, если их в системе достаточно много и у нас нет уверенности в "эквивалентности" условий работы всех магазинов фирмы.
Пусть мы имеем N магазинов — достаточно много, чтобы провести "массовый" эксперимент, но их нельзя отнести к одному и тому же типу. Например, мы можем различать четыре типа магазинов: А, Б, В и Г (аптечные, бакалейные, водочные и галантерейные).
Ясно также (хотя и для этого надо немножко разбираться в технологии торговли), что выручка магазина вполне может существенно зависеть от дня недели — пусть рабочие дни всех магазинов: Ср, Пт, Сб, Вс.
Первое, "простое" решение, которое приходит в голову — выбрать из N несколько магазинов наугад (применив равновероятное распределение их номеров) и применять некоторое время новую стратегию управления ими. Но столь же простые рассуждения приводят к мысли, что это будет не лучшее решение.


В самом деле — мы рассматриваем элементы системы как "равноправные" по нескольким показателям:

· мы ищем единую и наилучшую для фирмы в целом стратегию управления;

· мы используем единый для всех элементов показатель эффективности (дневную выручку).

И, в то же время, мы сами разделили объекты на группы и тем самым признаем различие во внешних условиях работы для различных групп. На языке ТССА это означает, что профессиональные знания в области управления торговлей помогают нам предположить наличие, по крайней мере, двух причин или факторов, от которых может зависеть выручка: профиль товаров магазина и день недели. Ни то, ни другое не может быть стабилизировано — иначе мы будем искать нечто другое: стратегию для управления только водочными магазинами и только по пятницам! А наша задача — поиск стратегии управления всеми магазинами и по любым дням их работы.
Хотелось бы решить эту задачу так: выбирать случайно как группы магазинов, так и дни недели, но иметь гарантию (уже не случайно!) представительности выходных данных испытания стратегии.
Теория планирования эксперимента предлагает особый метод решения этой проблемы, метод обеспечения случайности или рандомизации плана эксперимента. Этот метод основан на построении
специальной таблицы, которую принято называть латинским квадратом, если число факторов равно двум.
Для нашего примера, с числом стратегий 4, латинский квадрат может иметь вид табл. 3.10 или табл. 3.11.

Таблица 3.10

Ср
Пт
Сб
Вс
А
1
2
3
4
Б
3
4
1
2
В
2
1
4
3
Г
4
3
2
1


Таблица 3.11

1
2
3
4
Ср
А
Б
В
Г
Пт
В
Г
А
Б
Сб
Б
А
Г
В
Вс
Г
В
Б
А


В ячейках первой таблицы указаны номера стратегий для дней недели и магазинов данного профиля, причем такой план эксперимента гарантирует проверку каждой из стратегий в каждом профиле торговли и в каждый день работы магазина.
Конечно же, таких таблиц (квадратов) можно построить не одну — правила комбинаторики позволяют найти полное число латинских квадратов типа "4·4" и это число составляет 576. Для квадрата "3·3" имеется всего 12 вариантов, для квадрата "5·5" — уже 161 280 вариантов.


В общем случае, при наличии t стратегий и двух факторах, определяющих эффективность, потребуется N=a·t2 элементов для реализации плана эксперимента, где a в простейшем случае равно 1.
Это означает, что для нашего примера необходимо использовать 16 "управляемых" магазинов, так как данные, скажем второй строки и третьего столбца, нашего латинского квадрата означают, что по субботам в одном из выбранных наугад бакалейных магазинов будет применяться стратегия номер 1.
Отметим, что латинский квадрат для нашего примера может быть помтроен совершенно иначе — в виде таблицы 3.11, но по-прежнему будет определять все тот же, рандомизированный план эксперимента.
Пусть мы провели эксперимент и получили его результаты в виде следующей таблицы, в ячейках которой указаны стратегии и результаты их применения в виде сумм дневной выручки:

Таблица 3.12
Дни
Магазины
А Б В Г
Сумма
Вс
2: 47
1: 90
3: 79
4: 50
266
Ср
4: 46
3: 74
2: 63
1: 69
252
Пт
1: 62
2: 61
4: 58
3: 66
247
Сб
3: 76
4: 63
1: 87
2: 59
285
Сумма
231
288
287
244
1050
Итого по
стратегиям
1
308
2
230
3
295
4
217
1050/4=
262.5


Если вычислить, как и положено, средние значения, дисперсии и среднеквадратичные отклонения для четверок значений дневной выручки (по дням, магазинам и стратегиям), то мы будем иметь следующие данные:

Таблица 3.12А

Дни недели
Магазины
Стратегии
Среднее
262.5
262.5
262.5
Дисперсия
217.3
646.3
1563.3
СКО
14.74
25.42
39.5
Коэф.вариации
0.056
0.097
0.151


Уже такая примитивная статистическая обработка данных эксперимента позволяет сделать ряд важных выводов:

· сравнительно малые значения рассеяния данных по дням недели и по категориям магазинов в какой то мере вселяют надежду на правильный выбор плана эксперимента;

· разброс значений по стратегиям на этом фоне, скорее всего свидетельствует о большей зависимости дневной выручки от стратегии, чем от дней недели или категории магазина;

· заметное отличие средних по 1-й и 3-й стратегиям от средних по 2-й и 4-й, может быть основой для принятия решения — искать наилучшую стратегию, выбирая между 1-й и 3-й.


В этом — прямой практический результат использования рандомизированного плана, построения латинского квадрата.
Но это далеко не все. Теория планирования эксперимента дает, кроме способов построения планов с учетом возможных влияний на интересующую нас величину других факторов, еще и особые методы обработки полученных экспериментальных данных.
Самая суть этих методов может быть представлена так.

Пусть Wis есть выручка в i-м магазине при применении к нему s-й стратегии управления. Предполагается рассматривать эту выручку в виде суммы составляющих

Wis = W0 + Ds + ei; {3-25}
где:

· W0 определяет среднюю выручку для всех магазинов при условии применения к каждому из них всех стратегий по очереди с соблюдением постоянными всех других условий, влияющих на выручку;

· W0 + Ds есть средняя выручка при применении ко всем магазинам s-й стратегии;

· ei рассматривается как "ошибка измерения" — случайная величина с нулевым математическим ожиданием и нормальным законом распределения.

Несмотря на явную нереальность соблюдения постоянными внешних влияющих факторов, мы можем получить оценку каждого из слагаемых Wis и искать оптимальную стратегию через прибавку от ее применения Ds с учетом ошибки наблюдения. Можно считать доказанной "нормальность" распределения величины ei и использовать "правило трех сигм" при принятии решений по итогам эксперимента.


Содержание раздела