Группировка статистических данных
В результате первой стадии статистического исследования - статистического наблюдения - получают сведения о каждой единице совокупности. Задача второй стадии статистического исследования состоит в том, чтобы упорядочить и обобщить первичный материал, свести его в группы и на этой основе дать обобщенную характеристику совокупности. Этот этап в статистике называется сводкой. Различают простую сводку (подсчет только общих итогов) и статистическую группировку. Статистическая группировка сводится к расчленению совокупности на группы по существенному для единиц совокупности признаку. Группировка позволяет получить такие результаты, по которым можно выявить состав совокупности, характерные черты и свойства типичных явлений, обнаружить закономерности и взаимосвязи. Построение статистического ряда распределения включает следующие этапы: 1. Определение минимального (Хmin) и максимального (Хmax) значений признака.
где h - длина интервала, R -размах варьирования признака, n -объем выборки 3. Определение граничных значений интервалов (ai +bi). Так как Xmax и Xmin являются случайными величинами, рекомендуется отступить влево от нижнего предела варьирования. При этом, за нижнюю границу первого интервала предлагается принимать величину, равную Если оказывается, что , хотя по смыслу величина неотрицательная, то можно принять Верхняя граница первого интервала b1=a1+h. тогда, если b1-верхняя граница i-го интервала (причем a1+1=bi), то b2=a2+h, b3=a3+h и т.д., построение интервалов продолжается до тех пор, пока начало следующего по порядку интервала не будет равным или больше Xmax. 5. Группировка результатов наблюдений. Так как граничные значения признака могут совпадать с границами интервалов, то условимся в каждый интервал включать варианты большие,чем нижняя граница интервала (xi>ai), и меньшиеили равныеверхней границе (xi<bi). Примечание: Число интервалов обычно берут равным от 7 до 11 в зависимости от числа наблюдений и точности измерений с таким расчетом, чтобы интервалы были достаточно наполнены частотами. Если получают интервалы с нулевыми частотами, то нужно увеличить ширину интервала (особенно в середине интервального ряда). Построить вариационный ряд можно с помощью статистической функции Частота табличного процессора Excel Для этого надо ввести данные в столбец на листе таблицы, в соседний столбец ввести границы интервалов (определив длину интервала по вышеприведенной методике). Предварительно необходимо выделить столбец для вывода частот. Количество элементов в возвращаемом массиве должно быть на единицу больше числа элементов в массиве интервалов. Затем вызвать Мастер функций из меню Вставить, Функцию или по кнопке fх , выбрать в категории Статистические «Частота», из категории «Статистические». В появившемся окне необходимо заполнить аргументы функции. Первый аргумент функции «Частота» - массив данных, массив интервалов (массив карманов) – второй аргумент функции «Частота». Закончить ввод, необходимо нажатием клавиш Shift+Ctrl+Enter, так как в результате получаем не одно значение (число), а массив значений - частот.
©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|