d9e5a92d

Выборочное распределение выборочной средней


5.1. Введение.

Какие выводы о некотором параметре генеральной совокупности мы можем сделать, имея выборочное значение этого параметра? Ответ на этот вопрос зависит от того, имеем ли мы априорную информацию о величине генерального параметра.

Если априорная информация о величине генерального параметра отсутствует, то мы можем по выборочному значению оценить этот параметр, задав для него доверительный интервал, то есть границы, в которых его величина лежит с определенной доверительной вероятностью.

Если есть априорные соображения о величине генерального параметра, то мы можем проверить гипотезу о том, соответствует ли выборочная оценка априорному значению генерального параметра.

5.2. Выборочное распределение выборочной средней.

Пусть случайная величина Х имеет математическое ожидание ц и генеральную дисперсию О2. Оценками математического ожидания и дисперсии по выборке (x1, x2,..., xN) будут

выборочная средняя и выборочная дисперсия:

О =-

X=N Т-*

*=і

— I N2 I N

” ^ -Т (xk - X)2

N -1 й ‘

Рассмотрим случайную величину t = (X — ц)/(о / VN"). Так

как M(X) = ц и о(X) = о/4ы , то эта случайная величина имеет нулевое математическое ожидание и единичную дисперсию.

Будем считать, что величина t подчиняется распределению Стьюдента с V = N — 1 степенями свободы, хотя в общем случае это утверждение некорректно. Дело в том, что строго говоря величина t подчиняется распределению Стьюдента только в

случае когда выборка (x1, x2,..., XN) взята из нормально распределенной совокупности.



5.3. Доверительный интервал для генеральной средней.

Доверительный интервал возможных значений величины t, характеризующийся доверительной вероятностью P или уровнем значимости q = 1 — P , это такой интерквантильный

промежуток tq /2 ? < t < t1—q /2 ?, внутри которого лежат 100P процентов всех значений случайной величины t, а 100q процентов лежат вне этого промежутка. При этом 100q /2 процентов лежит слева от tq/2? и 100q/2 процентов лежит

справа ОТ t1—q /2,? .

Величины tq /2 ? и t1—q /2 ? - это квантили распределения

Стьюдента с ? = N — 1 степенями свободы, причем, так как это распределение симметрично и имеет нулевое математическое ожидание, то tq /2 ? = —t1— /2 ? . Используя последнее равенство и

подставив значение t = (X — /и)/(и / VN) получаем, что

X-у

a/VN

— t1

<t

1— q/2, V

1—q/2, ?

Отсюда следует, что доверительный интервал для математического ожидания /и через выборочную среднюю и выборочное с.к.о. задается в виде:

a

VN

a

VN

1—q/2, ?

1—q/2,?

Ширина доверительного интервала для математического ожидания очень существенно зависит от объема выборки. Проиллюстрируем это на простом примере. Пусть в двух испытаниях получены одинаковые значения выборочной средней X = 1.2 и выборочного с.к.о. a = 2.5. Но в первом случае эти данные были получены по выборке объемом N = 100, а во втором случае по выборке объемом N = 25. Зададимся уровнем значимости q = 0.05.

Вычислим с помощью функций Microsoft Excel доверительные интервалы для математического ожидания:

66

1) Большая выборка

X = 1.2

о = 2.5

N = 100

1-q/2, v

= СТЬЮДРАСПОБР(q, N -1) =

= СТЬЮДРАСПОБР(0.05, 99) = 1.984

2.5 2.5

1.2 -1.984^= <и< 12 +1.984- '

Vl00 ' ' л/100

0.704 <ju< 1.696

Ширина доверительного интервала = 1.696 - 0.704 = 0.992

2) Малая выборка

X = 1.2

о = 2.5

N = 25

1-q/2,v

= СТЬЮДРАСПОБР(q, N -1) =

= СТЬЮДРАСПОБР(0.05, 24) = 2.064

2.5 2.5

1.2-2.064^= <и< 1.2 + 2.064- '

?25 ?25

0.168 <ju< 2.232

Ширина доверительного интервала = 2.232 - 0.168 = 2.064

То есть для данных значений выборочной средней и выборочного с.к.о. увеличение объема выборки в 100/25=4 раза привело к уменьшению ширины доверительного интервала для математического ожидания в 2.064/0.992=2.08 раза.

5.4. Выборочное распределение выборочной дисперсии.

Пусть случайная величина Х имеет математическое ожидание /и и генеральную дисперсию о2. Оценками математического ожидания и дисперсии по выборке (x1, x2,..., xN) будут выборочная средняя и выборочная дисперсия:

г Z (Xk - X )2

1 к=1

N-k к 67

— 1 N

X = 1Z

к=1

Рассмотрим случайную величину = (N — 1)о /о2. Эта величина подчиняется % -распределению с V = N — 1 степенями

свободы, если выборочная средняя X нормально распределена. Для малых выборок это х -распределение имеет положительную асимметрию, но с увеличением объема выборки его асимметрия стремится к нулю.

5.5. Доверительный интервал для генеральной дисперсии.

Доверительный интервал возможных значений величины х2, характеризующийся доверительной вероятностью P или уровнем значимости q = 1 — P , это такой интерквантильный промежуток

X2qn V — X2 — Xi—q/2 V, внутри которого лежат 100P процентов

всех значений случайной величины X2, а 100q процентов лежат вне этого промежутка. При этом 100q 12 процентов лежит слева от ХІп V и 100q 12 процентов лежит справа от X\—q І2 V.

Величины X\n V и Xi-q І2 V - это квантили X2 -распределения с V = N — 1 степенями свободы. Подставив значение

X2 = (N — 1)о ІО2 получаем, что

— (N —1)0 < X

О2

2

qІ2, V

2

1—qІ2, V

Отсюда следует, что доверительный интервал для генеральной дисперсии через выборочную дисперсию задается в виде:

О —.(N - 1

(N —1)02

2

q І2, V

2

1—qІ2, V

Пусть в испытании получено значение выборочного с. к. о. О = 2.5 по выборке объемом N = 25. Зададимся уровнем значимости q = 0.05 .

Вычислим с помощью функций Microsoft Excel доверительный интервалы для генеральной дисперсии:

68

о = 2.5 N = 25 ? = N -1 = 25 -1 = 24

q/2 = 0.025 ^ Х.025,24 = ХИ2ОБР(1 - 0.025, 24) = 12.40 1 - q/2 = 0.975 ^ хізи, 24 = ХИ2ОБР(1 - 0.975, 24) = 39.36

2.52

12.4

2.52

39.36

<ст2 < 24

24

3.81 <ст2 < 12.10

Ширина доверительного интервала = 12.10 - 3.81 = 8.29

5.6. Статистическая проверка гипотез.

Статистическая гипотеза - это предположительное суждение о закономерностях, которым подчиняется случайная величина. Мы будем рассматривать гипотезы о величине параметров закона распределения вероятностей и о его виде.

Статистическая проверка гипотез - это система приемов, предназначенных для проверки соответствия эмпирических данных некоторой статистической гипотезе. Процесс проверки базируется на формулировании 2-х гипотез - нулевой и альтернативной:

- нулевая гипотеза H0 - это гипотеза, которая считается верной до тех пор, пока не будет доказано обратное исходя из результатов статистической проверки,

- альтернативная гипотеза H1 - это гипотеза, которая принимается, если в результате статистической проверки отвергается нулевая гипотеза.

Критерий проверки

Правило, по которому принимается или отклоняется нулевая гипотеза, называется статистическим критерием проверки. Построение критерия определяется выбором некоторой функции Q от результатов наблюдений, которая служит мерой расхождения между эмпирическими и теоретическими значениями. Функция Q называется статистикой критерия и является случайной величиной.

69

По распределению статистики Q находится такое значение Q0, что если гипотеза H0 верна, то вероятность того, что Q > Q0 равна q, где q - это заданный заранее уровень значимости. Если Q < Q0, то гипотеза H0 принимается, а если Q > Q0, то гипотеза H0 отвергается.

Ошибки 1-го и 2-го рода

При решении вопроса о справедливости гипотезы H0 могут быть допущены ошибки двух видов:

- ошибка первого рода происходит тогда, когда отвергается верная гипотеза H0 ,

- ошибка второго рода происходит тогда, когда принимается ложная гипотеза H0.

Уровень значимости

Очевидно, что уровень значимости q - это вероятность ошибки первого рода. Если он чрезмерно велик, то в основном ущерб будет связан с ошибочным отклонением верной гипотезы H0 , если же он чрезмерно мал, то ущерб будет возникать от ошибочного принятия ложной гипотезы H0. На практике в качестве

уровня значимости выбирают вероятность в пределах от 0.01 до 0.1.

5.7. Проверка гипотез о величине генеральной средней.

Располагая априорными суждениями о величине генеральной средней (математического ожидания) мы можем проверить гипотезу о том, соответствует ли выборочная средняя априорному значению математического ожидания.

Проверка гипотезы о соответствии выборочной средней априорному значению математического ожидания может быть односторонней (правосторонней или левосторонней) или двусторонней:

- двусторонняя проверка используется в том случае, когда необходимо проверить, равна ли выборочная средняя априор

70

ному значению математического ожидания, и гипотеза формулируется в виде:

H о : X = ц

И,: X Фц

- правосторонняя проверка используется в том случае, когда необходимо проверить, что выборочная средняя больше, чем априорное значение математического ожидания, и гипотеза формулируется в виде:

H о : X = ц

И,: X >ц

- левосторонняя проверка используется в том случае, когда необходимо проверить, что выборочная средняя меньше, чем априорное значение математического ожидания, и гипотеза формулируется в виде:

Но: X = ц

И,: X <ц

Проиллюстрируем проверку гипотез на примерах. Двусторонняя проверка гипотез

1) Априорная информация Математическое ожидание ц = 1

2) Результаты испытания

N = 100 X = 1.2 а = 2.5

3) Гипотеза Но: X = ц

И,: X Фц

4) Принятая величина уровня значимости q = 0.05

5) Критерий проверки

= X-ц а Л/N

6) Правило принятия решения

71

Пріятъ Но, ест _ tx_q /2>? < t < tx_q /2>v

В противном случае принять Ні , то есть Ні принимается, когда критерий проверки t попадает в критическую область

I t I > tl_q/2, V '

7) Расчет границ критической области

t1_q/2,V = СТЬЮДРАСПОБР(q, N _ 1) =

= СТЬЮДРАСПОБР(0.05, 99) = 1.984

8) Расчет критерия проверки

0.8

= X_л 1.2 -1 a/y[N 2.5/?І00

9)

Проверка гипотезы

0.8

Так как _ ti_q / 2, v < t < t1_q / 2, V

то критерий проверки t

не попадает в критическую область и мы принимаем гипотезу Н0 . Это означает, что при заданном уровне значимости выборочная средняя X = 1.2 статистически незначимо отличается от априорной величины математического ожидания л = 1.

Правосторонняя проверка гипотез

1) Априорная информация Математическое ожидание л = 0.7

2) Результаты испытания

N = 100 X = 1.2 а = 2.5

3) Гипотеза

Hr- X = л

Hji X> л

4) Принятая величина уровня значимости q = 0.05

5) Критерий проверки

t = X _л

a rJN

6) Правило принятия решения

72

Принять Н0, если t < t1- v

В противном случае принять Ні , то есть Ні принимается, когда критерий проверки t попадает в критическую область

t > tl—q, V •

7) Расчет границ критической области t1q ? = СТЬЮДРАСПОБР(2q, N -1) =

= СТЬЮДРАСПОБР(2 х 0.05, 99) = 1.66

8) Расчет критерия проверки

1.2 - 0.7

X-и

t = =-

=2

о/VN 2.5/?Ю0

Проверка гипотезы

Так как t > t1-q V , то критерий проверки t

9)

2 находится в

критической области и мы отвергаем гипотезу Н0 и принимаем гипотезу Ні. Это означает, что при заданном уровне значимости выборочная средняя X = 1.2 статистически значимо отличается от априорной величины математического ожидания /и = 0.7 .

Левосторонняя проверка гипотез

1) Априорная информация Математическое ожидание и = 1.5

2) Результаты испытания

N = 100 X = 1.2 о = 2.5

3) Гипотеза

Hr- X = и Hr. X<и

4) Принятая величина уровня значимости q = 0.05

5) Критерий проверки

t = X-и

о / 4N

6) Правило принятия решения

73

Принять Н0, если t > -t1-q v

В противном случае принять Ні , то есть Ні принимается, когда критерий проверки t попадает в критическую область

t <-t1-q,V •

7) Расчет границ критической области

- t1-q, ? = -СТЬЮДРАСПОБР(2q, N -1) =

= -СТЬЮДРАСПОБР(2 х 0.05, 99) = -1.66

8) Расчет критерия проверки

12 -1.5

= -12

(jl4N 2.5Л/І0Ю

Проверка гипотезы

Так как t > -t1- v , то критерий проверки t

9)

1.2 не попа

дает в критическую область и мы принимаем гипотезу Н0. Это означает, что при заданном уровне значимости выборочная средняя X = 1.2 статистически незначимо отличается от априорной величины математического ожидания ц = 1.5.

5.8. Проверка гипотез о величине генеральной дисперсии.

Располагая априорными суждениями о величине генеральной дисперсии мы можем проверить гипотезу о том, соответствует ли выборочная дисперсия априорному значению генеральной дисперсии.

Проверка гипотезы для дисперсии может быть односторонней (правосторонней или левосторонней) или двусторонней:

- двусторонняя проверка используется в том случае, когда необходимо проверить, равна ли выборочная дисперсия априорному значению генеральной дисперсии, и гипотеза формулируется в виде:

И0: и = и2 И,: Ц2 Фи2

- правосторонняя проверка используется в том случае, когда необходимо проверить, что выборочная дисперсия больше,

74

чем априорное значение генеральной дисперсии, и гипотеза формулируется в виде:

H о:

а

= а

Hi :

2



а



2

2

левосторонняя проверка используется в том случае, когда необходимо проверить, что выборочная дисперсия меньше, чем априорное значение генеральной дисперсии, и гипотеза формулируется в виде:

H о:

а



Hi :

2

а

<а‘

2

2

Проиллюстрируем проверку гипотез на примерах.

Двусторонняя проверка гипотез

1) Априорная информация Генеральная дисперсия а2 = 4

2) Результаты испытания

N = 25 а = 2.5 а" = 6.25

3) Гипотеза

H о:

и

C|

Hi :

2

а ^ а

2

2

4) Принятая величина уровня значимости q = 0.05

5) Критерий проверки

2

2 а

X2 = (N -1)— а2

6) Правило принятия решения

Принять Н0, если Xq2/2,V ^ X2 ^ Xl-q/2,? В противном случае принять Н1 , то есть Н1 принимается, когда критерий проверки X2 попадает в критическую обдастъ X2 < Xq/ 2, V или X2 >Xl-q /2,?

75

Расчет границ критической области

7)

8)

9)

ХІп, ? = Хо.о25,24 = ХИ2ОБР(1 - 0.025, 24) = 12.40

ХІЯ/2, ? = х0.975,24 = ХИ2ОБР(1 - 0.975,24) = 39.36

Расчет критерия проверки

2

Х2 = (N -1)и = 24— = 37.50 и2 4

Проверка гипотезы

Так как Х^г.?-Х2 - xf-q/2,?, то критерий проверки

Х2 = 37.50 не попадает в критическую область и мы принимаем гипотезу Н0. Это означает, что при заданном уровне

значимости выборочная дисперсия и = 6.25 статистически незначимо отличается от априорной величины генеральной дисперсии и2 = 4 .

Правосторонняя проверка гипотез

1) Априорная информация Генеральная дисперсия и2 = 3.6

2) Результаты испытания

N = 25 ц = 2.5 Ц2 = 6.25

3) Гипотеза

22

Н0 : и =и2

22 H1: и >и2

4) Принятая величина уровня значимости q = 0.05

5) Критерий проверки

2

2 и

Х2 = (N -1)— и2

6) Правило принятия решения Принять Но, если х2 - Х\,?

76

В противном случае принять Ні , то есть Ні принимается, когда критерий проверки х2 попадает в критическую обдастъ х2 > Xi-q,v

7) Расчет границ критической области

xlq, ? = Х0.95,24 = ХИ2ОБР(1 - 0.95, 24) = 36.42

8) Расчет критерия проверки

X2 = (N -1)—2 = 24625 = 41.67 о 3.6

9) Проверка гипотезы

Так как х2 > X12-q ? , то критерий проверки х2 = 41.67 находится в критической области и мы отвергаем гипотезу Н0 и принимаем гипотезу Ні. Это означает, что при заданном

—2

уровне значимости выборочная дисперсия о = 6.25 статистически значимо отличается от априорной величины генеральной дисперсии о2 = 3.6 .

Левосторонняя проверка гипотез

1)

2)

3)

4)

5)

6)

Априорная информация Генеральная дисперсия о2 = 9 Результаты испытания

N = 25 — = 2.5 —2 = 6.25

Гипотеза

22

Н0 : о = о2

22

H1: о <о2

Принятая величина уровня значимости q = 0.05

Критерий проверки

2

2 о

X2 = (N -1)— о

Правило принятия решения Принять Но, если х2 ^Хд,?

77

В противном случае принять Ні , то есть Ні принимается, когда критерий проверки х2 попадает в критическую обдастъ х2 <х\\,?

7) Расчет границ критической области %І?=ХІ05Л4 = ХИ 2ОБР(1 - 0.05, 24) = 13.85

8) Расчет критерия проверки

X2 = (N - 1)^г = 24— = 16.67 а2 9

9) Проверка гипотезы

Так как %2 > %2 ?, то критерий проверки %2 = 16.67 не

попадает в критическую область и мы принимаем гипотезу Н0. Это означает, что при заданном уровне значимости выборочная дисперсия а = 6.25 статистически незначимо отличается от априорной величины генеральной дисперсии а2 = 9.



Содержание раздела