Статистические выводы
5.1. Введение.
Какие выводы о некотором параметре генеральной совокупности мы можем сделать, имея выборочное значение этого параметра? Ответ на этот вопрос зависит от того, имеем ли мы априорную информацию о величине генерального параметра.
Если априорная информация о величине генерального параметра отсутствует, то мы можем по выборочному значению оценить этот параметр, задав для него доверительный интервал, то есть границы, в которых его величина лежит с определенной доверительной вероятностью.
Если есть априорные соображения о величине генерального параметра, то мы можем проверить гипотезу о том, соответствует ли выборочная оценка априорному значению генерального параметра.
5.2. Выборочное распределение выборочной средней.
Пусть случайная величина Х имеет математическое ожидание ц и генеральную дисперсию О
2. Оценками математического ожидания и дисперсии по выборке (x
1, x
2,..., x
N) будут
выборочная средняя и выборочная дисперсия:
О =-
X=N Т-*
*=і
— I
N —
2 I
N —
” ^ -Т (x
k - X)
2
N -1 й ‘
Рассмотрим случайную величину t = (X — ц)/(о / VN"). Так
как M(X) = ц и о(X) = о/4ы , то эта случайная величина имеет нулевое математическое ожидание и единичную дисперсию.
Будем считать, что величина t подчиняется распределению Стьюдента с V = N — 1 степенями свободы, хотя в общем случае это утверждение некорректно. Дело в том, что строго говоря величина t подчиняется распределению Стьюдента только в
случае когда выборка (x
1, x
2,..., X
N) взята из нормально распределенной совокупности.
5.3. Доверительный интервал для генеральной средней.
Доверительный интервал возможных значений величины t, характеризующийся доверительной вероятностью P или уровнем значимости q = 1 — P , это такой интерквантильный
промежуток t
q /2 ? < t < t
1—q /2 ?, внутри которого лежат 100P процентов всех значений случайной величины t, а 100q процентов лежат вне этого промежутка. При этом 100q /2 процентов лежит слева от t
q/2? и 100q/2 процентов лежит
спр
ава ОТ
t1—q /2,? .
Величины t
q /2 ? и t
1—q /2 ? - это квантили распределения
Стьюдента с ? = N — 1 степенями свободы, причем, так как это распределение симметрично и имеет нулевое математическое ожидание, то t
q /2 ? = —t
1— /2 ? . Используя последнее равенство и
подставив значение t = (X — /и)/(и / VN) получаем, что
X-у
a/VN
— t1
<t
1— q/2, V
1—q/2, ?
Отсюда следует, что доверительный интервал для математического ожидания /и через выборочную среднюю и выборочное с.к.о. задается в виде:
a
VN
a
VN
1—q/2, ?
1—q/2,?
Ширина доверительного интервала для математического ожидания очень существенно зависит от объема выборки. Проиллюстрируем это на простом примере. Пусть в двух испытаниях получены одинаковые значения выборочной средней X = 1.2 и выборочного с.к.о. a = 2.5. Но в первом случае эти данные были получены по выборке объемом N = 100, а во втором случае по выборке объемом N = 25. Зададимся уровнем значимости q = 0.05.
Вычислим с помощью функций Microsoft Excel доверительные интервалы для математического ожидания:
66
1) Большая выборка
X = 1.2
о = 2.5
N = 100
1-q/2, v
= СТЬЮДРАСПОБР(q, N -1) =
= СТЬЮДРАСПОБР(0.05, 99) = 1.984
2.5 2.5
1.2 -1.984^= <и< 12 +1.984- '
Vl00 ' ' л/100
0.704 <ju< 1.696
Ширина доверительного интервала = 1.696 - 0.704 = 0.992
2) Малая выборка
X = 1.2
о = 2.5
N = 25
1-q/2,v
= СТЬЮДРАСПОБР(q, N -1) =
= СТЬЮДРАСПОБР(0.05, 24) = 2.064
2.5 2.5
1.2-2.064^= <и< 1.2 + 2.064- '
?25 ?25
0.168 <ju< 2.232
Ширина доверительного интервала = 2.232 - 0.168 = 2.064
То есть для данных значений выборочной средней и выборочного с.к.о. увеличение объема выборки в 100/25=4 раза привело к уменьшению ширины доверительного интервала для математического ожидания в 2.064/0.992=2.08 раза.
5.4. Выборочное распределение выборочной дисперсии.
Пусть случайная величина Х имеет математическое ожидание /и и генеральную дисперсию о
2. Оценками математического ожидания и дисперсии по выборке (x
1, x
2,..., x
N) будут выборочная средняя и выборочная дисперсия:
г Z (Xk - X )
2
1 к=1
N-k к 67
— 1 N
X = 1Z
к=1
Рассмотрим случайную величину = (N — 1)о /о
2. Эта величина подчиняется % -распределению с V = N — 1 степенями
свободы, если выборочная средняя X нормально распределена. Для малых выборок это х -распределение имеет положительную асимметрию, но с увеличением объема выборки его асимметрия стремится к нулю.
5.5. Доверительный интервал для генеральной дисперсии.
Доверительный интервал возможных значений величины х
2, характеризующийся доверительной вероятностью P или уровнем значимости q = 1 — P , это такой интерквантильный промежуток
X
2qn
V — X
2 — Xi
—q/2 V, внутри которого лежат 100P процентов
всех значений случайной величины X
2, а 100q процентов лежат вне этого промежутка. При этом 100q 12 процентов лежит слева от ХІп
V и 100q 12 процентов лежит справа от X\
—q І2 V.
Величины X\n
V и Xi-
q І2 V - это квантили X
2 -распределения с V = N — 1 степенями свободы. Подставив значение
X
2 = (N — 1)о ІО
2 получаем, что
— (N —1)0 < X
О
2
2
qІ2, V
2
1—qІ2, V
Отсюда следует, что доверительный интервал для генеральной дисперсии через выборочную дисперсию задается в виде:
О —.(
N -
1)о
(N —1)0
2
2
q І2, V
2
1—qІ2, V
Пусть в испытании получено значение выборочного с. к. о. О = 2.5 по выборке объемом N = 25. Зададимся уровнем значимости q = 0.05 .
Вычислим с помощью функций Microsoft Excel доверительный интервалы для генеральной дисперсии:
68
о = 2.5 N = 25 ? = N -1 = 25 -1 = 24
q/2 = 0.025 ^ Х.
025,
24 = ХИ2ОБР(1 - 0.025, 24) = 12.40 1 - q/2 = 0.975 ^ хізи,
24 = ХИ2ОБР(1 - 0.975, 24) = 39.36
2.5
2
12.4
2.5
2
39.36
<ст
2 < 24
24
3.81 <ст
2 < 12.10
Ширина доверительного интервала = 12.10 - 3.81 = 8.29
5.6. Статистическая проверка гипотез.
Статистическая гипотеза - это предположительное суждение о закономерностях, которым подчиняется случайная величина. Мы будем рассматривать гипотезы о величине параметров закона распределения вероятностей и о его виде.
Статистическая проверка гипотез - это система приемов, предназначенных для проверки соответствия эмпирических данных некоторой статистической гипотезе. Процесс проверки базируется на формулировании 2-х гипотез - нулевой и альтернативной:
- нулевая гипотеза H
0 - это гипотеза, которая считается верной до тех пор, пока не будет доказано обратное исходя из результатов статистической проверки,
- альтернативная гипотеза H
1 - это гипотеза, которая принимается, если в результате статистической проверки отвергается нулевая гипотеза.
Критерий проверки
Правило, по которому принимается или отклоняется нулевая гипотеза, называется статистическим критерием проверки. Построение критерия определяется выбором некоторой функции Q от результатов наблюдений, которая служит мерой расхождения между эмпирическими и теоретическими значениями. Функция Q называется статистикой критерия и является случайной величиной.
69
По распределению статистики Q находится такое значение Q
0, что если гипотеза H
0 верна, то вероятность того, что Q > Q
0 равна q, где q - это заданный заранее уровень значимости. Если Q < Q
0, то гипотеза H
0 принимается, а если Q > Q
0, то гипотеза H
0 отвергается.
Ошибки 1-го и 2-го рода
При решении вопроса о справедливости гипотезы H
0 могут быть допущены ошибки двух видов:
- ошибка первого рода происходит тогда, когда отвергается верная гипотеза H
0 ,
- ошибка второго рода происходит тогда, когда принимается ложная гипотеза H
0.
Уровень значимости
Очевидно, что уровень значимости q - это вероятность ошибки первого рода. Если он чрезмерно велик, то в основном ущерб будет связан с ошибочным отклонением верной гипотезы H
0 , если же он чрезмерно мал, то ущерб будет возникать от ошибочного принятия ложной гипотезы H
0. На практике в качестве
уровня значимости выбирают вероятность в пределах от 0.01 до 0.1.
5.7. Проверка гипотез о величине генеральной средней.
Располагая априорными суждениями о величине генеральной средней (математического ожидания) мы можем проверить гипотезу о том, соответствует ли выборочная средняя априорному значению математического ожидания.
Проверка гипотезы о соответствии выборочной средней априорному значению математического ожидания может быть односторонней (правосторонней или левосторонней) или двусторонней:
- двусторонняя проверка используется в том случае, когда необходимо проверить, равна ли выборочная средняя априор
70
ному значению математического ожидания, и гипотеза формулируется в виде:
H о : X = ц
И,: X Фц
- правосторонняя проверка используется в том случае, когда необходимо проверить, что выборочная средняя больше, чем априорное значение математического ожидания, и гипотеза формулируется в виде:
H о : X = ц
И,: X >ц
- левосторонняя проверка используется в том случае, когда необходимо проверить, что выборочная средняя меньше, чем априорное значение математического ожидания, и гипотеза формулируется в виде:
Но: X = ц
И,: X <ц
Проиллюстрируем проверку гипотез на примерах. Двусторонняя проверка гипотез
1) Априорная информация Математическое ожидание ц = 1
2) Результаты испытания
N = 100 X = 1.2 а = 2.5
3) Гипотеза Но: X = ц
И,: X Фц
4) Принятая величина уровня значимости q = 0.05
5) Критерий проверки
= X-ц а Л/N
6) Правило принятия решения
71
Пріятъ Но, ест _ t
x_
q /2>? < t < t
x_
q /2>v
В противном случае принять Ні , то есть Ні принимается, когда критерий проверки t попадает в критическую область
I
t I >
tl_q/2, V '
7) Расчет границ критической области
t
1_
q/2,
V = СТЬЮДРАСПОБР(q, N _ 1) =
= СТЬЮДРАСПОБР(0.05, 99) = 1.984
8) Расчет критерия проверки
0.8
= X_л 1.2 -1 a/y[N 2.5/?І00
9)
Проверка гипотезы
0.8
Так как _
ti_q / 2, v <
t <
t1_q / 2, V
то критерий проверки t
не попадает в критическую область и мы принимаем гипотезу Н
0 . Это означает, что при заданном уровне значимости выборочная средняя X = 1.2 статистически незначимо отличается от априорной величины математического ожидания л = 1.
Правосторонняя проверка гипотез
1) Априорная информация Математическое ожидание л = 0.7
2) Результаты испытания
N = 100 X = 1.2 а = 2.5
3) Гипотеза
Hr- X = л
Hji X> л
4) Принятая величина уровня значимости q = 0.05
5) Критерий проверки
t = X _л
a rJN
6) Правило принятия решения
72
Принять Н
0, если t < t
1- v
В противном случае принять Ні , то есть Ні принимается, когда критерий проверки t попадает в критическую область
t >
tl—q, V •
7) Расчет границ критической области t
1q ? = СТЬЮДРАСПОБР(2q, N -1) =
= СТЬЮДРАСПОБР(2 х 0.05, 99) = 1.66
8) Расчет критерия проверки
1.2 - 0.7
X-и
t = =-
=2
о/VN 2.5/?Ю0
Проверка гипотезы
Так как t > t
1-q V , то критерий проверки t
9)
2 находится в
критической области и мы отвергаем гипотезу Н
0 и принимаем гипотезу Н
і. Это означает, что при заданном уровне значимости выборочная средняя X = 1.2 статистически значимо отличается от априорной величины математического ожидания /и = 0.7 .
Левосторонняя проверка гипотез
1) Априорная информация Математическое ожидание и = 1.5
2) Результаты испытания
N = 100 X = 1.2 о = 2.5
3) Гипотеза
Hr- X = и Hr. X<и
4) Принятая величина уровня значимости q = 0.05
5) Критерий проверки
t = X-и
о / 4N
6) Правило принятия решения
73
Принять Н
0, если t > -t
1-q v
В противном случае принять Ні , то есть Ні принимается, когда критерий проверки t попадает в критическую область
t <-t1-q,V •
7) Расчет границ критической области
- t
1-q,
? = -СТЬЮДРАСПОБР(2q, N -1) =
= -СТЬЮДРАСПОБР(2 х 0.05, 99) = -1.66
8) Расчет критерия проверки
12 -1.5
= -12
(jl4N 2.5Л/І0Ю
Проверка гипотезы
Так как t > -t
1- v , то критерий проверки t
9)
1.2 не попа
дает в критическую область и мы принимаем гипотезу Н
0. Это означает, что при заданном уровне значимости выборочная средняя X = 1.2 статистически незначимо отличается от априорной величины математического ожидания ц = 1.5.
5.8. Проверка гипотез о величине генеральной дисперсии.
Располагая априорными суждениями о величине генеральной дисперсии мы можем проверить гипотезу о том, соответствует ли выборочная дисперсия априорному значению генеральной дисперсии.
Проверка гипотезы для дисперсии может быть односторонней (правосторонней или левосторонней) или двусторонней:
- двусторонняя проверка используется в том случае, когда необходимо проверить, равна ли выборочная дисперсия априорному значению генеральной дисперсии, и гипотеза формулируется в виде:
И
0: и = и
2 И,: Ц
2 Фи
2
- правосторонняя проверка используется в том случае, когда необходимо проверить, что выборочная дисперсия больше,
74
чем априорное значение генеральной дисперсии, и гипотеза формулируется в виде:
левосторонняя проверка используется в том случае, когда необходимо проверить, что выборочная дисперсия меньше, чем априорное значение генеральной дисперсии, и гипотеза формулируется в виде:
Проиллюстрируем проверку гипотез на примерах.
Двусторонняя проверка гипотез
1) Априорная информация Генеральная дисперсия а
2 = 4
2) Результаты испытания
N = 25 а = 2.5 а" = 6.25
3) Гипотеза
|
H о:
|
и
C|
|
Hi :
|
2
а ^ а
|
|
2
2
|
4) Принятая величина уровня значимости q = 0.05
5) Критерий проверки
2
2 а
X
2 = (N -1)—
а2
6) Правило принятия решения
Пр
инять Н0,
если Xq
2/2,V ^ X
2 ^ Xl-q/2,? В противном случае принять Н
1 , то есть Н
1 принимается, когда критерий проверки X
2 попадает в критическую обдастъ X
2 < Xq/ 2, V
или X
2 >Xl-q /2,?
75
Расчет границ критической области
7)
8)
9)
ХІп, ? = Хо.о25,24 = ХИ2ОБР(1 - 0.025, 24) = 12.40
ХІ
Я/2, ? = х0.975,24 = ХИ2ОБР(1 - 0.975,24) = 39.36
Расчет критерия проверки
2
Х
2 = (N -1)
и = 24— = 37.50 и
2 4
Проверка гипотезы
Так как Х^г.?-Х
2 - xf
-q/2,
?, то критерий проверки
Х
2 = 37.50 не попадает в критическую область и мы принимаем гипотезу Н
0. Это означает, что при заданном уровне
значимости выборочная дисперсия и = 6.25 статистически незначимо отличается от априорной величины генеральной дисперсии и
2 = 4 .
Правосторонняя проверка гипотез
1) Априорная информация Генеральная дисперсия и
2 = 3.6
2) Результаты испытания
N = 25 ц = 2.5 Ц
2 = 6.25
3) Гипотеза
22
Н
0 : и =и
2
22 H
1: и >и
2
4) Принятая величина уровня значимости q = 0.05
5) Критерий проверки
2
2 и
Х
2 = (N -1)—
и2
6) Правило принятия решения Принять Но, если х
2 - Х\
-ч,
?
76
В противном случае принять Ні , то есть Ні принимается, когда критерий проверки х
2 попадает в критическую обдастъ х
2 > Xi-
q,v
7) Расчет границ критической области
xlq, ? = Х0.95,24 = ХИ2ОБР(1 - 0.95, 24) = 36.42
8) Расчет критерия проверки
X
2 = (N -1)—2 = 24
625 = 41.67 о 3.6
9) Проверка гипотезы
Так как х
2 > X
12-q ? , то критерий проверки х
2 = 41.67 находится в критической области и мы отвергаем гипотезу Н
0 и принимаем гипотезу Н
і. Это означает, что при заданном
—2
уровне значимости выборочная дисперсия о = 6.25 статистически значимо отличается от априорной величины генеральной дисперсии о
2 = 3.6 .
Левосторонняя проверка гипотез
1)
2)
3)
4)
5)
6)
Априорная информация Генеральная дисперсия о
2 = 9 Результаты испытания
N = 25 — = 2.5 —
2 = 6.25
Гипотеза
22
Н
0 : о = о
2
22
H
1: о <о
2
Принятая величина уровня значимости q = 0.05
Критерий проверки
2
2 о
X
2 = (N -1)— о
Правило принятия решения Принять Но, если х
2 ^Хд,
?
77
В противном случае принять Ні , то есть Ні принимается, когда критерий проверки х
2 попадает в критическую обдастъ х
2 <х\\,?
7) Расчет границ критической области %І?=ХІ05Л4 = ХИ 2ОБР(1 - 0.05, 24) = 13.85
8) Расчет критерия проверки
X
2 = (N - 1)^г = 24— = 16.67 а
2 9
9) Проверка гипотезы
Так как %
2 > %
2 ?, то критерий проверки %
2 = 16.67 не
попадает в критическую область и мы принимаем гипотезу Н
0. Это означает, что при заданном уровне значимости выборочная дисперсия а = 6.25 статистически незначимо отличается от априорной величины генеральной дисперсии а
2 = 9.
Содержание раздела