d9e5a92d

Корреляционная матрица

фак- инва- F_2 F_9 F_10 F_15 F_26 F_37 F_39 F_40 F_41 F_44 F_56 F_57 F_59 F_71 F_72
торы лиды
1992 1993 -0,42 -0,44 0,00 -0,24 -0,26 -0,38 0,00 -0,24 0,00 0,00 0,00 0,44 0,00 0,00 0,33
1993 1994 -0,50 -0,51 0,00 0,00 -0,31 -0,30 0,00 0,00 0,00 0,00 0,00 0,41 0,00 0,00 0,00
1994 1995 -0,43 -0,45 0,00 0,00 - - -0,24 0,00 0,00 0,00 0,00 0,38 0,00 0,00 0,00

?с лагом 2:

фак- инва- F_2 F_9 F_10 F_15 F_26 F_37 F_39 F_40 F_41 F_44 F_56 F_57 F_59 F_71 F_72
торы лиды
1992 1994 -0,50 -0,48 0,00 -0,26 -0,26 -0,38 0,00 0,00 0,00 0,00 0,00 0,37 -0,23 0,00
1993 1995 -0,43 -0,44 0,00 0,00 -0,27 -0,25 0,00 0,00 0,00 0,00 0,00 0,43 0,00 0,00

Анализ коэффициентов корреляции позволят выделить следующие внешние факторы-претенденты на включение в уравнение регрессии: F_2, F_9, F_26, F_37, F_57.
Из этих внешних факторов нужно исключить сильно коррелирующие между собой. Корреляционная матрица для них имеет вид:

F_2 F_9 F_15 F_26 F_37 F_39 F_40 F_41 F_44 F_56 F_57 F_59 F_71
F_2 1,00
F_9 0,46 1,00
F_15 -0,46 -0,24 1,00
F_26 0,48 -0,04 -0,64 1,00
F_37 -0,50 -0,18 0,53 -0,69 1,00
F_39 -0,43 -0,22 0,34 -0,36 0,28 1,00
F_40 0,09 0,02 0,01 0,12 -0,05 -0,12 1,00
F_41 0,17 0,20 -0,20 0,15 -0,08 0,00 0,03 1,00
F_44 -0,05 0,08 0,01 -0,03 0,02 0,01 0,07 0,16 1,00
F_56 0,04 0,03 -0,06 0,24 -0,09 -0,06 -0,04 0,10 0,05 1,00
F_57 -0,01 0,06 0,09 -0,08 -0,11 -0,16 0,17 0,14 0,09 -0,02 1,00
F_59 0,25 0,11 -0,12 0,15 -0,33 -0,34 0,15 0,07 0,03 -0,15 0,27 1,00
F_71 0,03 -0,06 0,08 0,12 0,04 -0,08 0,28 0,03 0,06 0,01 0,35 -0,10 1,00
F_72 -0,39 -0,08 0,17 -0,33 0,27 0,31 -0,31 -0,01 0,03 -0,13 -0,05 -0,16 -0,26

Анализ этой матрицы показывает, что имеет смысл оставить факторы F_9, F_57, а из остальных факторов - только один, так как они сильно коррелируют между собой.
Этап 2. Построение первоначальной регрессионной модели.
Уравнение регрессии ищется в виде:

Момент времени t соответствует 1994 году, а (t-1) - 1993 году. По методу наименьших квадратов получены следующие значения коэффициентов регрессии:

Коэффициенты Стандартная ошибка
Свободный член 2,518331 0,807525
y(t-1) 0,623338 0,065276
F_2 -0,01565 0,007639
F_9 -0,15978 0,098367
F_57 0,002848 0,005017

Статистический анализ полученной регрессии:

df SS MS F Значимость F
Регрессия 6 74,21074 12,36846 36,95291 1,49E-19
Остаток 68 22,76019 0,334709
Итого 74 96,97093

Таким образом, большая часть дисперсии рассматриваемого показателя инвалидности по пространственной выборке объясняется линией регрессии (SS регрессии SS остатка). Полученную зависимость следует признать значимой.
Этап 3. Модификация полученного уравнения регрессии осуществляется на основе анализа полученных коэффициентов и с учетом взаимных корреляций внешних факторов. В результате в уравнение регрессии включаются факторы: F_57 и F_9. Регрессионный анализ дает новую модель:

Коэффициенты Стандартная ошибка
Свободный член 1,704855 0,699168
y(t-1) 0,635231 0,064368
F_9 -0,20933 0,079657
F_57 0,004427 0,004869

Статистический анализ вновь полученной регрессии:

df SS MS F Значимость F
Регрессия 3 72,76425 24,25475 71,14099 2,37E-21
Остаток 71 24,20668 0,340939
Итого 74 96,97093

Анализ остатков показывает незначительное уменьшение доли дисперсии (с 74,21 до 72,76), объясняемой регрессией. Однако по-прежнему SS регрессии SS остатка и полученную зависимость следует признать удовлетворительной.
Реальные и прогнозируемые значения показателей инвалидности для рассматриваемых районов РФ приведены на графике в приложении 5.
Итак, на первом этапе построения математической модели были изучены взаимосвязи показателей инвалидности с внешними факторами. С целью построения модели прогнозирования на год вперед прежде всего была рассмотрена взаимосвязь с лаговым интервалом в один год. В качестве исходных данных были взяты значения показателей инвалидности за 1993 год и значения внешних факторов за 1992 год по 79-ти районам Российской Федерации. Для выявления величины взаимосвязи были рассчитаны парные коэффициенты корреляции, чтобы представить как увеличение или уменьшение значений внешних факторов связано с увеличением или уменьшением рассматриваемых показателей инвалидности.

Однако большие значения коэффициентов корреляции еще не говорят о наличии причинно-следственной связи. Они могут быть обусловлены одинаковым влиянием неучтенных факторов как на показатель инвалидности, так и на внешний фактор.

Интерпретацию полученных коэффициентов корреляции может сделать только специалист, углублено занимающийся проблемой инвалидности.
Аналогично были получены парные коэффициенты корреляции для других лаговых интервалов.
На основе рассчитанных показателей была предложена математическая модель прогноза в виде корреляционно-регрессионных зависимостей.

АНАЛИЗ РЕЗУЛЬТАТА ВЕРИФИКАЦИИ МОДЕЛИ

Любая предлагаемая математическая модель должна быть адекватна изучаемому явлению. Это основное условие эффективного применения статистической модели. В данном случае адекватность - не отражение в модели всех деталей описываемого явления, а принципиальное соответствие результатов моделирования изменениям и соотношениям, имеющим место в действительности.

Для проверки адекватности модели производят верификацию модели на данных, не используемых при построении модели.
Процесс построения модели для прогнозирования всегда основан на анализе исходных данных, так как прогностическая модель должна адекватно отражать закономерности, присущие реальным процессам.
Таким образом, этапы построения математической модели для прогноза и верификация реальных данных должны выполняться параллельно. На рис.

2 приведены основные этапы, связанные с верификацией реальных данных и построением математической модели.
Выполненная верификация реальных статистических данных при построении прогностической математической модели заключалась в следующем.
1. Исследована возможность построения прогноза показателей инвалидности с помощью линейного тренда. Исследование показало, что такое описание динамики удовлетворительно не более чем для 10% районов.

В остальных районах линейный тренд оказался незначимым: дисперсия, объясняемая с помощью линейного тренда, оказалась меньше дисперсии, связанной с отклонениями от тренда.
2. С целью выяснения применимости тех или иных статистических процедур изучены законы распределения временных рядов с показателями инвалидности. Анализ реальных данных показал, что их законы распределения в основном отличны от нормального и за редким исключением могут быть хорошо описаны логнормальным распределением. Гистограммы, построенные по реальным данным для нескольких показателей инвалидности, приведены в приложении 2.
Рис.2 Этапы построения математической модели
3. Аналогично исследованы законы распределения внешних факторов. Анализ реальных статистических данных за 1992 год показал, что их законы распределения могут быть приближены либо нормальным, либо логнормальным распределениями.

Однако для внешних факторов характер распределения является менее выраженным и во многих случаях приближение тем или иным законом распределения является спорным. Примеры гистограмм для нескольких внешних факторов приведены в приложении 4.
4. Исследовано, являются ли имеющиеся временные ряды стационарными, то есть наблюдается ли изменение во времени таких характеристик как математическое ожидание, дисперсия, мода, медиана, эксцесс, асимметрия. Анализ реальных данных по показателям инвалидности за 1992, 1993 и 1994 годы показал, что эти временные ряды следует в целом считать нестационарными. При этом в соседние годы изменение характеристик незначительно.

Поэтому на коротких временных отрезках (порядка 3-х лет) изучаемые временные ряды можно с известной долей приближения рассматривать как стационарные.
5. По реальным рядам динамики (показатели инвалидности) частично исследовано поведение автокорреляции. Анализ статистических данных за 1992 - 1994 годы показал, что корреляции между соседними точками для всех показателей инвалидности выше для интервала 1994-1993 гг., чем для интервала 1993-1992 гг. Однако эта разница не
превышает 0.1.
6. По реальным данным изучена взаимосвязь показателей инвалидности (за 1992, 1993 и 1994 годы) и внешних факторов (за 1992 год). Было выявлено, что каждый показатель инвалидности коррелирует с большим числом внешних факторов, причем коэффициенты корреляции при этом редко превышают 0.5.

Кроме того было установлено, что степень взаимосвязи факторов с показателями инвалидности во времени для разных факторов изменяется по-разному.
7. По реальным значениям внешних факторов (за 1992 год) изучен характер взаимосвязи внешних факторов между собой. Внешние факторы, коэффициент корреляции которых превышает 0.07, можно считать коллинеарными и в модели использовать только один фактор из каждой такой пары.
Рассмотренный корреляционно-регрессионный подход к решению задачи прогнозирования инвалидности может дать удовле-творительное качество прогноза по большинству регионов только в случае унимодального характера распределений по пространственным выборкам как показателей инвалидности, так и внешних факторов. Следует отметить, что качество прогноза тем не менее существенно снижается для небольшой группы регионов, в которых значения используемых показателей сильно отличаются от остальных регионов.

Поэтому можно сказать, что область применения классической экономико-статистической модели ограничивается однородными пространственными выборками.
Кроме того, классическая экономико-статистическая модель не учитывает случай, когда можно выделить несколько групп регионов со сходными значениями показателей инвалидности и (или) внешних факторов внутри каждой группы и значимыми отличиями между группами. Тем более ситуация усложняется, если с течением времени наблюдается картина перехода отдельных регионов из одной группы в другую.

В этом случае потребуется разработка более сложной прогнозной модели, основанной на методах классификации.

МЕТОДИКА ПРОГНОЗИРОВАНИЯ ИНВАЛИДНОСТИ

Построение прогноза показателей инвалидности по территориям РФ можно реализовать с использованием системы Excel for WINDOWS. Ниже представлен сценарий построения прогноза.
1. Подготовка исходных данных.
? Ввести исходные данные по рассматриваемому показателю
инвалидности:
столбец 1 - номер территории РФ,
столбец 2 - значение показателя инвалидности.
За каждый год данные вводятся на отдельном листе рабочей книги Excel.
? Ввести исходные данные по имеющимся факторам:
столбец 1 - номер территории РФ,
каждый из последующих столбцов - для очередного внешнего


фактора.
За каждый год данные вводятся на отдельном листе рабочей книги Excel.
Все данные должны быть приведены для одних и тех же территорий РФ: лишние территории (строки таблиц) удаляются. Порядок перечисления территорий во всех таблицах должен быть одинаковым.
2. Выделение внешних факторов, связанных с рассматриваемым показателем инвалидности.
? Рассчитать парные коэффициенты корреляции между показателем инвалидности за текущий год и внешними факторами за последние годы (с разными лагами). Полученные коэффициенты корреляции целесообразно свести в общую таблицу (см. пример выше).
? В качестве факторов, имеющих устойчивую взаимосвязь с рассматриваемым показателем инвалидности, выделить имеющие значимые коэффициенты корреляции для разных лагов. Выделенные факторы - претенденты на включение в регрессионную модель.
3. Расчет парных коэффициентов корреляции, соответствующих "лишних" факторов и показателей инвалидности за текущий год в случае нестабильной временной структуры внешних факторов (по некоторым факторам отсутствуют данные за отдельные периоды времени).
Претендентами на включение в регрессионную модель считать факторы с коэффициентами корреляции, превышающими 0.3. Включение должно осуществляться с соответствующим лагом (f(t-2), f(t-3) и т.п.).
4. Выявление взаимосвязи для "лишних" факторов - претендентов на включение в уравнение регрессии с остальными факторами в период времени, за который эти факторы предполагается включить в уравнение регрессии.
Рассчитать матрицу взаимных парных коэффициентов корреляции между всеми факторами за соответствующий год. Если факторы-претенденты значимо коррелируют (коэффициенты корреляции превышают 0.5) с факторами, включаемыми в уравнение регрессии на предыдущих шагах, их следует исключить из числа претендентов.
5. Выделение факторов, сильно коррелирующих друг с другом.
Вычислить взаимные коэффициенты корреляции между факторами за каждый из рассматриваемых годов. Сильно взаимосвязанные факторы - с коэффициентами корреляции, превышающими 0.5.

Из каждой полученной группы взаимосвязанных факторов в итоговую регрессионную модель может быть включен только один фактор.
6. Формирование исходных данных для оценивания параметров регрессии.
Осуществить на отдельном рабочем листе Excel после определения факторов-претендентов. Данные целесообразно представить в виде:
столбец 1 - номер района;
столбец 2 - значение показателя инвалидности за текущий год (y(t)) играет роль отклика;
столбец 3 - значение показателя инвалидности за предыдущий год (y(t-1));
остальные столбцы - значения отобранных факторов с соответствующими лагами.
7. Анализ параметров уравнения регрессии.
В Excel для этого следует использовать режим "Сервис"-"Анализ данных"-"Регрессия". Если в меню "Сервис" отсутствует "Анализ данных", его можно подключить в режиме "Сервис"-"Дополнения"-"Пакет анализа". Выбрав режим "Регрессия", необходимо задать следующие параметры:
"Входной интервал Y" - вводится или выделяется диапазон ячеек, содержащий значения откликов (значения показателя инвалидности за текущий год);
"Входной интервал X" - вводится или выделяется диапазон ячеек, содержащий значения независимых переменных: показателя инвалидности за предыдущий год y(t-1) и все включаемые в уравнение факторы;
"Метки" - помечается, если в заданные перед этим диапазоны ячеек попали ячейки с заголовками столбцов (целесообразно осуществлять для более легкой читаемости результатов);
"Параметры вывода" - целесообразно задать "Новый рабочий лист" (в этом случае результаты регрессионного анализа будут представлены на отдельном рабочем листе);
"Остатки" - помечаются "Остатки" и "Стандартизованные остатки";
остальные параметры необязательны.
Может представлять интерес задание "Уровня надежности" в процентах. В этом случае будут получены доверительные интервалы для параметров регрессии не только с надежностью 95% (по правилу умолчания), но и с заданной.
8. Анализ таблицы дисперсионного анализа (ANOVA) (1).
Полученную регрессию следует считать значимой, если сумма квадратов отклонений относительно среднего SS, обусловленная регрессией, будет много больше, чем SS относительно регрессии (остаток), или, что аналогично, Rквадрат близок к значению 1. Средний квадрат относительно регрессии (MS остатка) дает оценку дисперсии регрессии. Множественный коэффициент корреляции Rквадрат определяет значение корреляции между истинным значением оцениваемого показателя инвалидности (откликом) и предсказанным значением показателя инвалидности по регрессии.
9. Возможное исключение незначимых факторов из уравнения регрессии. Пересчет параметров итоговой регрессии.
10. Получение прогноза значения показателя инвалидности на следующий год y(t+1) по всем регионам.
В полученное уравнение регрессии для каждого региона следует подставить соответствующие значения показателя инвалидности и внешних факторов, взятые со сдвигом на один год вперед.

КОНЦЕПЦИЯ ПРОГНОЗА ПЕРВИЧНОГО ВЫХОДА
НА ИНВАЛИДНОСТЬ

В настоящее время как статус, так и прогнозы инвалидизации населения в решающей мере определяются и будут определяться какое-то время социально-экономическими условиями. Формального прогноза социально-экономического развития в России не существует.

Это определяет необходимость гибкого сочетания формального прогнозирования с интуитивным, концептуальным, экспертным прогнозом.

Предпрогнозная ориентация

Эндогенная ситуация


В долгосрочной динамике первичной инвалидизации населения отчетливо выделяется три этапа.
Первый - с 1980 по 1989 г. включительно, когда показатель инвалидности был относительно стабилен и на этом фоне отмечались всплески коньюнктурного характера, принципиально не менявшие общей
ситуации.
Второй этап, начавшийся в 1990 г. и продолжавшийся до 1992 г., - этап стремительного роста первичной инвалидизации - на 46,4% за три года. Рост инвалидизации был практически целиком стимулирован перекосами пенсионного законодательства и введением дополнительных льгот для инвалидов.

Таким образом, рост инвалидности не имел отношения к динамике других показателей здоровья, в частности смертности.
С 1993 г. наступил третий этап, фактически означающий возвращение к прежней тенденции, то есть к отсутствию систематической динамики инвалидности.
Региональная группировка территорий РФ по уровню инвалидизации выглядит следующим образом. Группа с низким уровнем формируется в основном за счет национальных республик и территорий с молодой структурой населения, расположенных, как правило, на европейском и азиатском Севере. Группа со стабильно высоким уровнем - это столичные города (Москва и Санкт-Петербург).

Среднюю, наиболее многочисленную группу образуют территории европейской части России, а также преимущественно русские регионы Северного Кавказа, Урала и Сибири с относительно стабильным населением и нормальной (для России) поло-возрастной структурой населения.
Структурно причина первичного выхода на инвалидность выглядит следующим образом. Половина всей первичной инвалидизации населения обусловлена болезнями системы кровообращения.

В пять раз менее значимы злокачественные новообразования. Третье, четвертое и пятое места занимают соответственно травматизм и отравления, болезни нервной системы и органов чувств, психические расстройства. Эти пять классов причин обусловливают 80% всей первичной инвалидизации
населения.
Среди новых инвалидов 12% имеют 1 группу, порядка 72% - 2 группу, соответственно 16% инвалидов имеют 3 группу. Инвалидность первой группы в двух из трех случаев определяется болезнями системы кровообращения и злокачественными новообразованиями.

Значимость всех других причин несопоставимо меньше. Структура инвалидности 3-ей группы значительно более пестрая.

Наряду с болезнями системы кровообращения, на долю которых приходится почти третья часть новых инвалидов этой группы, еще три класса причин вносят существенный вклад: травмы и отравления, болезни нервной системы, болезни костно-мышечной системы.
Среди новых инвалидов четвертая часть - это лица в возрасте не старше 45-50 лет. Еще около 20% инвалидов дает последнее предпенсионное десятилетие. Таким образом, более половины новых инвалидов - это пожилые люди. Главными причинами инвалидности молодых людей являются травмы и отравления, а также психические расстройства.

В предпенсионном возрасте на первые места выходят болезни системы кровообращения и новообразования. У пожилых главной и, пожалуй, единственной причиной инвалидности становятся болезни системы кровообращения.
Структурно инвалидность городских и сельских жителей довольно близка. Различие только в возрастной структуре новых инвалидов, связанное, с одной стороны, с различиями возрастно-половой структуры городского и сельского населения, с другой - с тем обстоятельством, что в селе выше инвалидность молодых людей, а в городе - пожилых.
В связи с тем, что система учета инвалидности за последние несколько лет дважды претерпела принципиальные изменения, отсутствует возможность оценить сдвиги в структурных характеристиках инвалидности по мере изменения масштабов этого явления.

Экзогенная ситуация

Анализ и прогноз инвалидности как сложного системного феномена означает, что мы рассматриваем инвалидность как одну из характеристик здоровья населения во всем многообразии действующих на нее факторов, что принципиально отличается от привычного подхода к оценке инвалидизации населения как характеристике работы службы ВТЭК.
По данным экспертов Всемирной организации здравоохранения, специфическими факторами, которые влияют и будут влиять на будущую пропорцию инвалидов в мире, являются пять групп факторов:
изменения в возрастной структуре населения;
изменения в структуре заболеваемости и смертности;
изменения в развитии служб здравоохранения;
рост урбанизации;
развитие индустриализации.
Было выявлено, что в 54,7% случаев наступление инвалидности в основном обусловлено быстрым проградиентным течением хронического заболевания и в 41,6% случаев - влиянием неблагоприятных факторов.
В инвалидизации населения активного трудоспособного возраста наибольшее значение имеют следующие конкретные факторы риска:
неблагоприятные условия жизнеобеспечения людей, наличие хронических стрессовых ситуаций, напряженность во взаимоотношениях в семье, плохие жилищно-бытовые и материальные условия, а также вредные привычки (гипо- и адинамия, ожирение, гипертензия);
неудовлетворительные условия производственной среды (вредные производственные факторы, высокое нервно-эмоциональное и физическое напряжение в ходе выполняемой работы, неблагоустроенное рабочее место, вынужденная рабочая поза, неудобная сменность работы, плохие санитарно-гигиенические условия);
некачественное медицинское обслуживание (несвоевременное выявление заболевания, ошибки в диагностике, несвоевременное и неадекватное лечение, отсутствие диспансерного наблюдения до определения группы инвалидности, отсутствие или некачественное проведение профосмотров и динамического наблюдения за инвалидами);



Содержание раздела