d9e5a92d

Мультиномиальная логистическая регрессия



16.5 Мультиномиальная логистическая регрессия

Этот метод является вариантом логистической регрессии, при которой зависимая переменная не является дихотомической, как при бинарной логистической регрессии, а имеет больше двух категорий. В то время как, при бинарной логистической регрессии независимая переменная может иметь интервальную шкалу, то мультиномиальная логистическая регрессия пригодна только для категориальных независимых переменных, причём имеет значение, относятся ли они к шкале наименований или к порядковой шкале. Конечно же, не исключается возможность задания в качестве ковариат переменных, имеющих интервальную шкалу.

Начиная с 10 версии SPSS для независимых переменных, относящихся к порядковой шкале предусмотрен метод порядковой регрессии (см. гл. 16.6), который в данном случае является предпочтительным.

Для представления метода мольтиномиальной логистической регрессии был сначала взят простой пример с одной независимой переменной. Данные для этого примера "ыли взяты из ALLBUS (общий социологический опрос населения) 1998 года.

  • Откройте файл polein.sav, и при помощи выбора меню Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Frequencies... (Частоты)

достройте частотные таблицы для четырёх переменных, находящихся в этом файле:

Alter (Возраст)

Frequency (Частота)

Percent (Процент)

Valid Percent (Действи- тельный процент)

Cumulative Percent (Совокупный процент)



Valid (Действи- тельное значение)

bis 45 Jahre (До 45 лет)

1306

50,1

50,1

50,1

ueber 45 Jahre (Свыше 45 лет)

1301

49,9

49,9

100,0

Total (Сумма)

2607

100,0

100,0

Politische Links-Rechts-Einschaetzung (Политическая принадлежность к левым или правым)

Frequency (Частота)

Percent (Процент)

Valid Percent (Действи- тельный процент)

Cumulative Percent (Совокупный процент)

Valid (Действи- тельное значение)

eher links (Скорее левый)

740

28,4

28,4

28,4

Mitte (Центрист)

1212

46,5

46,5

74,9

eher rechts (Скорее правый)

655

25,1

25,1

100,0

Total (Сумма)

2607

100,0

100,0

Schicht (Прослойка)

Frequency (Частота)

Percent (Процент)

Valid Percent (Действи- тельный процент)

Cumulative Percent (Совокупный процент)

Valid (Действи- тельное

Unterschicht (Нижняя прослойка)

879

33,7

33,7

33,7

значение)

Mittelschicht (Средняя прослойка)

1477

56,7

56,7

90,4

Oberschicht (Верхняя прослойка)

251

9,6

9,6

100,0

Total (Сумма)

2607

100,0

100,0

Schulbildung (Школьное образование)

Frequency (Частота)

Percent (Процент)

Valid Percent (Действи- тельный процент)

Cumulative Percent (Совокупный процент)

Valid (Действи- тельное значение)

Hauptschule (Неполное среднее)

1499

57,5

57,5

57,5

Mittlere Reife (Среднее)

610

23,4

23,4

80,9

Abitur (Атестат зрелости)

498

19,1

19,1

100,0

Total (Сумма)

2607

100,0

100,0

Мы хотим рассмотреть переменную polire (Политическая принадлежность к левым или правым) как зависимую переменную, а три остальные — как независимые переменные (факторы). В первом примере в качестве независимой переменной мы возьмем только переменную "Alter" (Возраст). Прежде всего построим таблицу сопряженности для этих двух переменных.

  • Выберите в меню Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Crosstabs... (Таблицы сопряженности)

Переменной alter присвойте статус строчной переменной, a polire — столбцовой переменной, и через выключатель Cells... (Ячейки) активируйте вывод процентных показателей для ячеек.

Alter * Politische Links-Rechts-Einschfltzung Crosstabulation

(Возраст * Политическая принадлежность к левым или правым - таблица сопряженности)

Politische Links-Rechts-Einschfltzung (Политическая принадлежность к левым или правым)

Total (Сумма)

eher links (Скорее левый)

Mitte (Цент- рист) eher rechts (Скорее правый)

Alter (Воз-раст)

bis 45 Jahre (До 45 лет)

Count (Коли- чество)

446

615

245

1306

% of Total (% от возраста)

34,2%

47,1%

18,8%

100,0%

ueber 45 Jahre (Свыше 45 лет)

Count % of Total (Коли- чество)

294

597

410

1301

(% от возраста)

22,6%

45,9%

31,5%

100,0%

Total (Сум- ма)

Count (Коли- чество)

740

1212

655

2607

% of Total (% от возраста)

28,4%

46,5%

25,1%

100,0%

Для младшей возрастной категории политическое самоопределение имеет тенденцию склонения симпатий к левым партиям, а для старшей — скорее к правым. Рассмотрим простую мультиномиальную логистическую модель, которая отражает взаимосвязь между политическим самоопределением и возрастом.

Так как политическое самоопределение, как зависимая переменная, включает три категории, то для определения вероятностей отнесения респондентов к этим трем категориям можно сформировать два недублированных логита, причём последняя категория "eher rechts" (скорее правый) будет использоваться как эталонная:


Рис. 16.17: Диалоговое окно Multinomial Logistic Regression (Множественная логистическая регрессия)



Рис. 16.18: Диалоговое окно Multinomial Logistic Regression: Statistics (Множественная логистическая регрессия: Статистики)


Содержание таблицы результатов расчёта, выглядит следующим образом. Для не дублирующих категорий она содержит параметрические оценки, стандартную ошибку, проверку значимости при помощи статистики Вальда, значение экспоненциальной функции от параметрической оценки и его доверительный интервал.

Parameter Estimates (Оценки параметров)

Politische Links-Rechts-Einschaetzung (Политическая принадлежность к левым или правым)

В

Std. Error (Станда- ртная ошибка)

Wald (Вальд)

df (Сте-пень сво- боды)

Sig. (Значи- мость)

Ехр(В)

95% Confidence Interval for Ехр(В) (95 % довери- тельный интервал для Ехр(В))

Lower Bound (Нижний предел)

Upper Bound (Верхний предел)

eher links (Скорее левый)

Intercept (Постоян- ное слага- емое)

-,333

,076

18,938

1

,000

[ALTER= 1,00]

,932

,110

71,353

1

,000

2,539

2,045

3,151

[ALTER= 2,00]

Оа

0

0

,

Mitte (Цен-трист)

Intercept (Постоян- ное слага-емое)

,376

,064

34,320

1

,000

[ALTER= 1,00]

,545

,099

30,198

1

,000

1,724

1,420

2,094

rALTER= 2,00]

0"

0

0

a. This parameter is set to zero because it is redundant (Данный параметр обнуляется, т.к. он является дублирующим)

Из таблицы можно взять следующие значения для b-коэффициентов:

b10 =-0,333

b11 (до 45 лет) = 0,932

b20 = 0,376

b21 (до 45 лет) = 0,545 1

Таким образом, для возрастной группы до 45 лет получим

g1 = -0,333 + 0,932 = 0,599

g2 = -0,376 + 0,545 = 0,921

и следовательно


Рис. 16.19: Диалоговое окно Multinomial Logistic Regression: Model (Множественная логистическая регрессия: Модель)


  • Постройте самостоятельно ещё одну логистическую регрессию, в которой Вы можете взять .переменную schicht (Принадлежность к прослойке) в качестве третьего фактора.



Содержание раздела