Однако в ходе наблюдения могут возникнуть погрешности. Погрешности, появляющиеся в процессе наблюдения, называются ошибками наблюдения. Все погрешности, возникающие при сплошном наблюдении, называются ошибками регистрации, которые, в свою очередь, подразделяются на случайные и систематические.
При несплошном наблюдении могут возникать специфические ошибки, называемые ошибками репрезентативности. Они возникают потому, что отобранная обследованная совокупность недостаточно воспроизводит (репрезентует) всю исходную
совокупность.
После получения статистических формуляров следует провести проверку полноты и качества собранных данных. Контроль полноты - это проверка того, насколько полно охвачен объект наблюдением, т.е. о всех ли единицах наблюдения собраны сведения.
Контроль качества материала осуществляется с помощью логического и арифметического контроля.
Сводка и группировка. Важнейшим (вторым) этапом исследования социально-экономических явлений и процессов является систематизация первичных данных и получение на этой основе сводной характеристики объекта в целом при помощи обобщающих показателей, что достигается путем сводки и группировки первичного статистического материала.
Сводка - это комплекс последовательных операций по обобщению конкретных единичных факторов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению.
Проведение сводки необходимо осуществлять по следующим этапам: 1) выбор группировоч-ного признака; 2) определение порядка формирования групп: установление числа групп, образование интервалов; 3) разработка системы статистических показателей для характеристики групп и объекта в целом (сказуемое группировки); 4) разработка макетов статистических таблиц для
представления результатов сводки.
По глубине обработки материала сводка бывает простая и сложная.
Простой сводкой называется операция по подсчету общих итогов по совокупности единиц наблюдения.
Сложная сводка - комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему объекту и представление результатов группировки и сводки в виде статистических таблиц.
Метод группировок в статистике является основным методом и средством обобщения и анализа статистической информации о экономических процессах в жизни общества. Сущность метода группировок состоит в расчленении исследуемых совокупностей единиц (фактов, событий, явлений) на части (группы) по соответствующим характерным признакам.
С помощью метода группировок рассматриваются следующие основные вопросы: выбор признаков как научных оснований для выявления групп, количество и границы образуемых групп. Для построения групп в статистике используются в основном два вида признаков: качественные (атрибутивные) и количественные (численные).
С помощью метода группировок решаются следующие задачи: 1) выделение социально-экономических типов явлений; 2) изучение структуры явления и структурных сдвигов, происходящих в нем;
3) выявление связи и зависимости между явлениями.
В соответствии с задачами группировки различают следующие ее виды: типологическая, структурная, аналитическая.
Типологическая группировка - это расчленение разнородной совокупности на отдельные качественно однородные группы и выявление на этой основе экономических типов явлений.
Структурной называется группировка, которая предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку.
Аналитической называется группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками.
Группировка, в которой группы образованы по одному признаку, называется простой.
Сложной (комбинированной) называется группировка, в которой разделение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации).
Вторичная группировка - образование новых групп на основе ранее осуществленной группировки. Получение новых групп возможно двумя способами перегруппировки: объединением первоначальных интервалов (путем их укрупнения) и долевой перегруппировкой (на основе закрепления за каждой группой определенной доли единиц совокупности).
Особым видом группировок являются классификации - систематическое распределение явлений и объектов на определенные группы, классы, разряды на основании их сходства и различия. Классификация выступает в роли своеобразного статистического стандарта.
Построение группировки начинается с определения состава группировочного признака. Группиро-вочным называется признак, по которому проводится разбиение единиц совокупности на отдельные группы.
В основание группировки могут быть положены как количественные, так и атрибутивные признаки.
После того как определено основание группировки, следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность, при этом необходимо обратить особое внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака, а также на особенности объекта и цели исследования. Определение числа групп можно осуществить, используя формулу Стерджесса:
n = 1 + 3,322lqN,
где n - число групп; N - число единиц совокупности.
Когда определено число групп, то следует определить интервалы группировки. Интервал - это значения варьирующего признака, лежащее в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.
Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в интервале.
Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше интервал, и наоборот.
Величина интервала представляет собой разность между верхней и нижней границами интервала. Интервалы группировки в зависимости от их величины бывают равные и неравные.
Величина равного интервала определяется по формуле:
(1)
где xmax и xmin - максимальное и минимальное значения признака в совокупности; n - число групп.
Интервалы групп могут быть закрытыми, когда указана нижняя и верхняя границы, и открытыми, когда указана лишь одна из границ.
Следующий этап - отбор показателей, которые характеризуют группы, и определение их величины по каждой группе, но сначала строится ряд распределения.
Показатели, характеризующие работу предприятий, разносятся по группам, и подсчитываются итоги по ним. Результаты группировки заносятся в таблицу, и определяются общие итоги по совокупности единиц наблюдения по каждому показателю.
Количественная характеристика наблюдаемых совокупностей явлений дает наглядное представление о направлениях и тенденциях развития изучаемых нами процессов.
По статистической структуре показатели, входящие в систему, можно условно разделить на три группы: абсолютные (объемные), относительные и средние.
Абсолютные и относительные показатели. Все используемые в статистике показатели по форме выражения классифицируются на абсолютные и относительные.
Абсолютные показатели отражают абсолютные размеры изучаемых статистикой процессов и явлений, а именно их массу, площадь, объем, временные характеристики, а также могут представлять объем совокупности, т.е. число составляющих ее единиц. Так, основная масса народнохозяйственных абсолютных показателей фиксируется в первичных учетных документах.
Абсолютными величинами в статистике называются численности единиц и суммы по группам и в целом по совокупности, которые являются непосредственным результатом сводки и группировки данных.
В статистике все абсолютные величины являются именованными и измеряются в натуральных, стоимостных, трудовых или условных единицах измерения (чел., р., шт., кВт-ч., чел.-дн., и т.д.) и, в отличие от математического понятия абсолютной величины, могут быть как положительными, так и отрицательными (убытки, потери и т. д.).
Абсолютные величины часто получаются путем определенных расчетов, целью которых чаще всего является приведение к соизмеримому выражению слагаемых, входящих в абсолютную величину. Так, например, прежде чем получить общее количество выпускаемой предприятием продукции, приходится приводить различные виды продукции к соизмеримым показателям.
Чаще всего это делается с помощью условно-натуральных измерений, ценностного выражения, иногда через трудозатраты.
Иногда абсолютные величины того или иного статистического показателя рассчитываются на основе определенной теории и определенных правил. Относительные величины являются важнейшими статистическими показателями, дополняющими сведения абсолютных величин.
Каждая относительная величина представляет собой дробь, ее числителем является величина, которую хотят сравнить, а знаменателем - величина, с которой производится сравнение. Знаменатель относительной величины называется базой сравнения.
Таким образом, результатом такого сопоставления являются относительные статистические величины
Относительный показатель - представляет собой числовую меру соотношения двух сопоставляемых абсолютных величин.
Основное условие правильного расчета относительной величины - сопоставимость сравниваемых показателей и наличие реальных связей между изучаемыми явлениями. Относительный показатель может выражаться в коэффициентах, процентах, промилле, продецимилле или быть именованным числом.
Все используемые на практике относительные статистические показатели можно подразделить на следующие виды:
1 Показатели динамики (ОПД):
ОПД = Текущий показатель / Предшествующий или базовый пока-затель.
2 Относительные показатели плана (ОПП) и реализации плана (ОПРП):
ОПП = Показатель, планируемый на (і + 1)-й период / Показатель, достигнутый в (і - 1)-й период;
ОПРП = Показатель, достигнутый в (і + 1)-й период / Показатель, планируемый на (і + 1)-й период.
3 Показатель структуры (ОПС):
ОПС = Показатель, характеризующий часть совокупности /
Показатель по всей совокупности в целом.
4 Показатель координации (ОПК):
ОПК = Показатель, характеризующий і-ю часть совокупности / Показатель, характеризующий часть совокупности, выбранную в качестве базы сравнения.
5 Показатель интенсивности (ОПИ):
ОПИ = Показатель, характеризующий явление А / Показатель, характеризующий среду распространения явления А.
6 Показатель сравнения (ОПСр):
ОПСр = Показатель, характеризующий объект А / Показатель, характеризующий объект Б.
7 Показатели уровня экономического развития - характеризуют производство продукции в расчете на душу населения.
Сущность средних величин и их виды. Наиболее распространенной формой статистических показателей, используемой в социально-экономических исследованиях, является средняя величина.
Средняя величина представляет собой обобщенную количественную характеристику признака в статистической совокупности в конкретных условиях места и времени. Средняя арифметическая величина представляет собой самый распространенный вид средней величины.
Различают степенные и структурные средние. К степенным средним относятся: средняя геометрическая, средняя гармоническая, средняя арифметическая и средняя квадратическая.
Все степенные средние могут быть либо взвешенными, либо невзвешенными (простыми). Простая средняя считается по несгруппированным данным и имеет следующий вид:
где xi - варианта (значение) осредняемого признака; m - показатель степени средней; n - число вариант. Взвешенная средняя считается по сгруппированным данным:
(3)
I X?fi
где f - частота, показывающая, сколько раз встречается i-е значение осредняемого признака.
В качестве структурных средних чаще всего используют моду и медиану.
Модой называется вариант признака, имеющий наибольшую частоту. Мода - это наиболее часто встречающаяся в совокупности величина варианта.
Медиана представляет собой вариант, находящийся в середине ранжированного (упорядоченного) ряда всех значений признака. В вариационных рядах мода определяется по наибольшей частоте.
Для определения медианы вычисляются накопленные частоты, медианным будет тот вариант, накопленная частота которого первой превысит половину всех частот.
В практике мода и медиана часто используются вместо средней арифметической или наряду с ней.
Показатели вариации. Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака.
Изучение вариации признаков общественных явлений находится в прямой связи с группировками, в частности с рядами распределения.
При статистическом анализе вариационных рядов используются различные показатели (меры) вариации в зависимости от поставленных перед исследователем задач. К ним относятся:
1 Размах вариации (R) является наиболее простым измерителем признака:
где xmax и Хітііп соответственно наибольшее и наименьшее значения варьирующего признака.
2 Среднее линейное отклонение (d) представляет собой среднюю величину из отклонений вариантов признака от их средней. Его можно рассчитать по формуле средней арифметической, как взвешенной, так и невзвешенной:
невзвешенное среднее линейное отклонение;
взвешенное среднее линейное отклонение.
3 Дисперсия (ст2) представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины. Дисперсия вычисляется по формулам простой невзвешенной и взвешенной:
X(X- - x)2
--невзвешенная;
ст
- взвешенная.
ст
4 Среднее квадратическое отклонение (ст) представляет собой корень второй степени из среднего квадрата отклонений отдельных значений признака от их средней:
X(X - x)2
--невзвешенное;
n
ст =
Xx - x)! fV Xf
- взвешенное.
ст =
Среднее квадратическое отклонение имеет размерность осредняемого признака.
6 Коэффициент вариации:
Vd = d 100 % - линейный коэффициент вариации;
X
?ст =ст 100 % - коэффициент вариации.
X
Эти показатели обычно выражаются в процентах и характеризуют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % (для распределений, близких к нормальному).
Под выборочным наблюдением понимается такое несплошное наблюдение, при котором статистическому обследованию подвергаются единицы изучаемой совокупности, отобранные случайным способом.
Совокупность отобранных для обследования единиц в статистике принято называть выборочной, а совокупность единиц, из которых производится отбор, - генеральной. Выборка может быть: 1) собственно-случайная; 2) механическая; 3) типическая; 4) серийная; 5) комбинированная.
При организации выборочного наблюдения решаются такие вопросы, как определение способа отбора и процедуры выборки, вычисление ошибок выборки и построение доверительных интервалов выборочных характеристик, а также расчет необходимой численности выборки.
При стратифицированном отборе, не пропорциональном объему групп, общее число отбираемых единиц делится на количество групп. Полученная величина даст объем выборки из каждой группы.
При отборе, пропорциональном числу единиц в группе, число наблюдений по каждой группе определяется формулой:
где пг - объем выборки г-й группы; n - общий объем выборки; Ni - объем г-й группы; N - объем генеральной совокупности.
При отборе с учетом вариационного признака, дающем минимальную величину ошибки выборки, процент выборки из каждой стратифицированной группы должен быть пропорционален среднему квадратическому отклонению в этой группе.
Пг =
Для доли:
nN^W (1 - W
X Njy/Wj (1 - W) '
где W - выборочная доля.
При серийном (гнездовом) отборе необходимую численность отбираемых серий определяют так же, как и при собственно случайном, только вместо N, n и а2 подставляют R, r и а2м.гр., где R - число серий в генеральной совокупности; r - число отобранных серий; а2м.
гр. - межсерийная (межгрупповая) дисперсия.
Расчет ошибок позволяет решить одну из главных проблем организации выборочного наблюдения -оценить репрезентативность (представительность) выборочной совокупности. Различают среднюю и предельную ошибку выборки.
Расчет средней и предельной ошибок выборки позволяет определить возможные пределы, в которых будут находиться характеристики генеральной совокупности (табл. 1).
Виды и формы связи. Из множества разнообразных форм проявления взаимосвязей в качестве двух самых общих их видов выделяют функциональную (полную) и корреляционную (неполную) связи.
В первом случае величине факторного признака строго соответствует одно или несколько значений функции.
Стохастическая связь - связь, которая проявляется не в каждом отдельном случае, а в общем, среднем или большом числе наблюдении. Корреляционная связь (статистическая) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной.
По направлению связи бывают прямыми и обратными, положительными и отрицательными.
Прямая связь - с увеличением или уменьшением значений факторного признака увеличивается или уменьшается значение результативного.
Обратная связь - с увеличением или уменьшением значений факторного признака уменьшается или увеличивается значение результа- тивного.
Относительно своей аналитической формы связи делятся на линейные и нелинейные.
Линейная связь - статистическая связь между явлениями, выраженная уравнением прямой линии.
Нелинейная связь - статистическая связь между социально-экономическими явлениями, аналитически выраженная уравнением кривой линии (параболы, гиперболы и т.д.).
С точки зрения взаимодействующих факторов связи могут быть парными и множественными. Кроме этого различают также непосредственные, косвенные и ложные связи.
Парная связь - аналитическое выражение связи двух признаков.
Множественная связь - модель связи трех и более признаков.
Методы изучения статистической связи. Для выявления наличия связи, ее характера и направления в статистике используются методы: приведения параллельных данных; аналитических группировок; графический; корреляции.
Метод приведения параллельных данных основан на сопоставлении двух или нескольких рядов статистических величин.
Графически взаимосвязь двух признаков изображается с помощью поля корреляции. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи.
При отсутствии тесных связей имеет место беспорядочное расположение точек на графике.
Корреляционно-регрессионный анализ включает в себя измерение тесноты, направления связи и установление аналитического выражения (формы) связи (регрессионный анализ).
Теоретическая обоснованность моделей взаимосвязи, построенных на основе корреляционнорегрессионного анализа, обеспечивается соблюдением следующих основных условий:
7 Все признаки и их совместные распределения должны подчиняться нормальному закону распределения.
8 Дисперсия моделируемого признака (У) должна все время оставаться постоянной при изменении величины У и значений факторных признаков.
9 Отдельные наблюдения должны быть независимыми, т.е. результаты, полученные в i-м наблюдении, не должны быть связаны с предыдущими и содержать информацию о последующих наблюдениях, а также влиять на них.
Одной из проблем построения уравнения регрессии является ее размерность, т.е. определение числа факторных признаков, включаемых в модель. Их число должно быть оптимальным.
Одним из методов корреляционно-регрессионного анализа является метод парной корреляции, рассматривающий влияние вариации факторного признака х на результативный у. Аналитическая связь между ними описывается уравнениями:
|
|||||||||
х |