Здавалка
Главная | Обратная связь

Группировка статистических данных



В результате первой стадии статистического исследования - статистического наблюдения - получают сведения о каждой единице совокупности. Задача второй стадии статистического исследования состоит в том, чтобы упорядочить и обобщить первичный материал, свести его в группы и на этой основе дать обобщенную характеристику совокупности. Этот этап в статистике называется сводкой. Различают простую сводку (подсчет только общих итогов) и статистическую группировку. Статистическая группировка сводится к расчленению совокупности на группы по существенному для единиц совокупности признаку. Группировка позволяет получить такие результаты, по которым можно выявить состав совокупности, характерные черты и свойства типичных явлений, обнаружить закономерности и взаимосвязи.

Построение статистического ряда распределения включает следующие этапы:

1. Определение минимального (Хmin) и максимального (Хmax) значений признака.

  1. Определение размаха варьирования признака: R=Xmax-Xmin
  2. Определение длины интервала: ,

где h - длина интервала, R -размах варьирования признака, n -объем выборки

3. Определение граничных значений интервалов (ai +bi).

Так как Xmax и Xmin являются случайными величинами, рекомендуется отступить влево от нижнего предела варьирования. При этом, за нижнюю границу первого интервала предлагается принимать величину, равную

Если оказывается, что , хотя по смыслу величина неотрицательная, то можно принять

Верхняя граница первого интервала b1=a1+h. тогда, если b1-верхняя граница i-го интервала (причем a1+1=bi), то b2=a2+h, b3=a3+h и т.д., построение интервалов продолжается до тех пор, пока начало следующего по порядку интервала не будет равным или больше Xmax.

5. Группировка результатов наблюдений.

Так как граничные значения признака могут совпадать с границами интервалов, то условимся в каждый интервал включать варианты большие,чем нижняя граница интервала (xi>ai), и меньшиеили равныеверхней границе (xi<bi).

Примечание:

Число интервалов обычно берут равным от 7 до 11 в зависимости от числа наблюдений и точности измерений с таким расчетом, чтобы интервалы были достаточно наполнены частотами. Если получают интервалы с нулевыми частотами, то нужно увеличить ширину интервала (особенно в середине интервального ряда).

Построить вариационный ряд можно с помощью статистической функции Частота табличного процессора Excel

Для этого надо ввести данные в столбец на листе таблицы, в соседний столбец ввести границы интервалов (определив длину интервала по вышеприведенной методике). Предварительно необходимо выделить столбец для вывода частот. Количество элементов в возвращаемом массиве должно быть на единицу больше числа элементов в массиве интервалов. Затем вызвать Мастер функций из меню Вставить, Функцию или по кнопке fх , выбрать в категории Статистические «Частота», из категории «Статистические».

В появившемся окне необходимо заполнить аргументы функции. Первый аргумент функции «Частота» - массив данных, массив интервалов (массив карманов) – второй аргумент функции «Частота». Закончить ввод, необходимо нажатием клавиш Shift+Ctrl+Enter, так как в результате получаем не одно значение (число), а массив значений - частот.

 

 







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.