16.5 Мультиномиальная логистическая регрессия
Этот метод является вариантом логистической регрессии, при которой зависимая переменная не является дихотомической, как при бинарной логистической регрессии, а имеет больше двух категорий. В то время как, при бинарной логистической регрессии независимая переменная может иметь интервальную шкалу, то мультиномиальная логистическая регрессия пригодна только для категориальных независимых переменных, причём имеет значение, относятся ли они к шкале наименований или к порядковой шкале. Конечно же, не исключается возможность задания в качестве ковариат переменных, имеющих интервальную шкалу.
Начиная с 10 версии SPSS для независимых переменных, относящихся к порядковой шкале предусмотрен метод порядковой регрессии (см. гл. 16.6), который в данном случае является предпочтительным.
Для представления метода мольтиномиальной логистической регрессии был сначала взят простой пример с одной независимой переменной. Данные для этого примера "ыли взяты из ALLBUS (общий социологический опрос населения) 1998 года.
-
Откройте файл polein.sav, и при помощи выбора меню Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Frequencies... (Частоты)
достройте частотные таблицы для четырёх переменных, находящихся в этом файле:
Alter (Возраст)
|
Frequency (Частота) |
Percent (Процент) |
Valid Percent (Действи- тельный процент) |
Cumulative Percent (Совокупный процент) | |
Valid (Действи- тельное значение) |
bis 45 Jahre (До 45 лет) |
1306 |
50,1 |
50,1 |
50,1 |
ueber 45 Jahre (Свыше 45 лет) |
1301 |
49,9 |
49,9 |
100,0 | |
Total (Сумма) |
2607 |
100,0 |
100,0 |
|
Politische Links-Rechts-Einschaetzung (Политическая принадлежность к левым или правым)
|
Frequency (Частота) |
Percent (Процент) |
Valid Percent (Действи- тельный процент) |
Cumulative Percent (Совокупный процент) | |
Valid (Действи- тельное значение) |
eher links (Скорее левый) |
740 |
28,4 |
28,4 |
28,4 |
Mitte (Центрист) |
1212 |
46,5 |
46,5 |
74,9 | |
eher rechts (Скорее правый) |
655 |
25,1 |
25,1 |
100,0 | |
Total (Сумма) |
2607 |
100,0 |
100,0 |
|
Schicht (Прослойка)
Frequency (Частота) |
Percent (Процент) |
Valid Percent (Действи- тельный процент) |
Cumulative Percent (Совокупный процент) | ||
Valid (Действи- тельное |
Unterschicht (Нижняя прослойка) |
879 |
33,7 |
33,7 |
33,7 |
значение) |
Mittelschicht (Средняя прослойка) |
1477 |
56,7 |
56,7 |
90,4 |
|
Oberschicht (Верхняя прослойка) |
251 |
9,6 |
9,6 |
100,0 |
|
Total (Сумма) |
2607 |
100,0 |
100,0 |
|
Schulbildung (Школьное образование)
Frequency (Частота) |
Percent (Процент) |
Valid Percent (Действи- тельный процент) |
Cumulative Percent (Совокупный процент) | ||
Valid (Действи- тельное значение) |
Hauptschule (Неполное среднее) |
1499 |
57,5 |
57,5 |
57,5 |
Mittlere Reife (Среднее) |
610 |
23,4 |
23,4 |
80,9 | |
Abitur (Атестат зрелости) |
498 |
19,1 |
19,1 |
100,0 | |
Total (Сумма) |
2607 |
100,0 |
100,0 |
|
Мы хотим рассмотреть переменную polire (Политическая принадлежность к левым или правым) как зависимую переменную, а три остальные — как независимые переменные (факторы). В первом примере в качестве независимой переменной мы возьмем только переменную "Alter" (Возраст). Прежде всего построим таблицу сопряженности для этих двух переменных.
-
Выберите в меню Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Crosstabs... (Таблицы сопряженности)
Переменной alter присвойте статус строчной переменной, a polire — столбцовой переменной, и через выключатель Cells... (Ячейки) активируйте вывод процентных показателей для ячеек.
Alter * Politische Links-Rechts-Einschfltzung Crosstabulation
(Возраст * Политическая принадлежность к левым или правым - таблица сопряженности)
|
Politische Links-Rechts-Einschfltzung (Политическая принадлежность к левым или правым) |
Total (Сумма) | ||||
eher links (Скорее левый) | Mitte (Цент- рист) | eher rechts (Скорее правый) | ||||
Alter (Воз-раст) |
bis 45 Jahre (До 45 лет) | Count (Коли- чество) |
446 | 615 |
245 |
1306 |
% of Total (% от возраста) |
34,2% | 47,1% |
18,8% |
100,0% | ||
ueber 45 Jahre (Свыше 45 лет) | Count % of Total (Коли- чество) |
294 | 597 |
410 |
1301 | |
(% от возраста) |
22,6% | 45,9% |
31,5% |
100,0% | ||
Total (Сум- ма) |
| Count (Коли- чество) |
740 | 1212 |
655 |
2607 |
% of Total (% от возраста) |
28,4% | 46,5% |
25,1% |
100,0% |
Для младшей возрастной категории политическое самоопределение имеет тенденцию склонения симпатий к левым партиям, а для старшей — скорее к правым. Рассмотрим простую мультиномиальную логистическую модель, которая отражает взаимосвязь между политическим самоопределением и возрастом.
Так как политическое самоопределение, как зависимая переменная, включает три категории, то для определения вероятностей отнесения респондентов к этим трем категориям можно сформировать два недублированных логита, причём последняя категория "eher rechts" (скорее правый) будет использоваться как эталонная:
Рис. 16.17: Диалоговое окно Multinomial Logistic Regression (Множественная логистическая регрессия)
Рис. 16.18: Диалоговое окно Multinomial Logistic Regression: Statistics (Множественная логистическая регрессия: Статистики)
Содержание таблицы результатов расчёта, выглядит следующим образом. Для не дублирующих категорий она содержит параметрические оценки, стандартную ошибку, проверку значимости при помощи статистики Вальда, значение экспоненциальной функции от параметрической оценки и его доверительный интервал.
Parameter Estimates (Оценки параметров)
Politische Links-Rechts-Einschaetzung (Политическая принадлежность к левым или правым) |
В |
Std. Error (Станда- ртная ошибка) |
Wald (Вальд) |
df (Сте-пень сво- боды) |
Sig. (Значи- мость) |
Ехр(В) |
95% Confidence Interval for Ехр(В) (95 % довери- тельный интервал для Ехр(В)) | ||
Lower Bound (Нижний предел) |
Upper Bound (Верхний предел) | ||||||||
eher links (Скорее левый) |
Intercept (Постоян- ное слага- емое) |
-,333 |
,076 |
18,938 |
1 |
,000 |
|
|
|
[ALTER= 1,00] |
,932 |
,110 |
71,353 |
1 |
,000 |
2,539 |
2,045 |
3,151 | |
[ALTER= 2,00] |
Оа |
0 |
|
0 |
|
, |
|
| |
Mitte (Цен-трист) |
Intercept (Постоян- ное слага-емое) |
,376 |
,064 |
34,320 |
1 |
,000 |
|
|
|
[ALTER= 1,00] |
,545 |
,099 |
30,198 |
1 |
,000 |
1,724 |
1,420 |
2,094 | |
rALTER= 2,00] |
0" |
0 |
|
0 |
|
|
|
|
a. This parameter is set to zero because it is redundant (Данный параметр обнуляется, т.к. он является дублирующим)
Из таблицы можно взять следующие значения для b-коэффициентов:
b10 =-0,333
b11 (до 45 лет) = 0,932
b20 = 0,376
b21 (до 45 лет) = 0,545 1
Таким образом, для возрастной группы до 45 лет получим
g1 = -0,333 + 0,932 = 0,599
g2 = -0,376 + 0,545 = 0,921
и следовательно
Рис. 16.19: Диалоговое окно Multinomial Logistic Regression: Model (Множественная логистическая регрессия: Модель)
-
Постройте самостоятельно ещё одну логистическую регрессию, в которой Вы можете взять .переменную schicht (Принадлежность к прослойке) в качестве третьего фактора.