Здавалка
Главная | Обратная связь

Описательная статистика



Описательная статистика – это раздел математической статистики, включающий систему статистических методов измерения, представления и описания совокупностей данных. Главная задача элементарной описательной статистики по отношению к качественным данным – подсчитать количество наблюдений каждого типа и при необходимости рассортировать эти наблюдения.

Меры центральной тенденции. Мера центральной тенденции – это число, характеризующее выборку по уровню выраженности измеренного признака.. Средние величины — это обобщающие показатели, в которых находят выражение действие внешних условий, закономерность изучаемого явления.

Для характеристики структуры совокупности применяются структурные средние — мода и медиана.

1. Мода (Мо)— это такое значение в множестве наблюдений, которое встречается наиболее часто, или то значение признака, которое соответствует максимальной точке теоретической кривой распределений.

2. Медиана (Ме)— величина, которая делит численность упорядоченного вариационного ряда на две равные части: одна часть имеет значения варьирующего признака меньше, чем средний вариант, а другая — больше.

3. Наиболее распространенным видом средних величин является средняя арифметическая (Хср, М):

Выбор средней зависит от задачи, стоящей перед последователем, характера исходных величин.

Чаще всего при обработке и анализе материала наблюдения пользуются средней арифметической. Среднее арифметическое должно опираться на все наблюдения, чтобы быть характеристикой всего распределения.

Медиану следует применять в качестве характеристики уровня ряда в тех случаях, когда имеются очень большие колебания изучаемого признака. В этом случае на будут оказывать сильное влияние крайние значения признака, в то время как медиана менее чувствительна к ним. На медиану влияет не столько колебание значений признака, сколько колебание числа случаев на том или ином уровне.

Моду особенно удобно применять при изучении качественных признаков. При изучении количественных признаков мода обычно вычисляется в дополнение к среднему арифметическому, не заменяя его.

Среднее квадратическое применяется при исчислении среднего квадратического отклонения, а также при вычислении степени изменчивости признака.

Меры изменчивости– это численное выражение величины межиндивидуальной вариации признака.

1. Размах (R) показывает, насколько велико различие между единицами совокупности, имеющими самое маленькое и самое большое значение признака. Его рассчитывают как разность между наибольшим (Xmax) и наименьшим (Xmin) значениями варьирующего признака, т.е.

Размах является грубой мерой изменчивости, т.к. в ходе вычисления не учитывается каждое отдельное значение.

2. Дисперсия тоже является мерой рассеяния, что отображено в самом термине (“дисперсия” и означает “рассеяние”). Иногда дисперсия носит названиефлуктуации, девианты. Чем больше дисперсия, тем больше разброс данных. Дисперсия Dмера рассеяния, определяемая как величина, равная среднему значению квадрата отклонений отдельных значений признака от средней арифметической

3. Среднеквадратичное (стандартное) отклонение. Наиболее употребительной мерой рассеяния является стандартное (или среднее квадратическое) отклонение. Там, где требуется учитывать качество (наименование) случайной величины, такая мера, какой является дисперсия, неудобна. Тогда применяется стандартное отклонение.

Стандартное отклонениеσ(s) – мера разнообразия (разброса) входящих в группу объектов, показывающая, на сколько в среднем отклоняется каждая варианта (конкретное значение оцениваемого параметра) от средней арифметической:

Чем сильнее разбросаны варианты относительно средней, тем большим оказывается и σ(s). Следует указать, что для “не очень” асимметричных распределений справедливо приближенное равенство, связывающее среднее арифметическое и стандартное отклонения.

4. Стандартизация или Z–преобразование данных– это перевод измерений в стандартную шкалу со средней Мz=0 и Dzz)=1.







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.