Здавалка
Главная | Обратная связь

Параметры распределения или описательная статистика

1.Лимиты(limits, limes, lim) – значения минимальной (хmin) и максимальной (хmax) вариант, между которыми располагаются все члены данной совокупности.

2. Размах вариации(range): R = хmax – хmin. Величина размаха в общих чертах даёт представление об изменчивости (вариативности) признака в выборке.

3. Среднее арифметическое (mean): (М) = ∑xi/n. Средняя арифметическая – это основная мера центральной тенденции, дающая представление о выраженности признака в выборке в целом.

4. Стандартное (среднеквадратическое) отклонение (standard deviation, std.dv., СКО) – один из важнейших показателей описательной статистики, характеризующий разброс, рассеяние результатов выборки вокруг среднего арифметического:

или или

5. Стандартная ошибка среднего (standard error., std.err., m, СОС) m = s/SQRT(n). Она показывает, какие значения следует считать неотличимыми от рассчитанной средней. Она также позволяет определить точность, с которой характеризует значение среднего по всей генеральной совокупности.

6. Коэффициент вариации V = (s/M) ∙100%; показывает фактическую изменчивость признака, выраженную в процентах к максимально возможной изменчивости.

7. Коэффициент точности измерения средней (mean measuring precision): Cs = (m/M)∙100%. По этому показателю можно судить о близости выборочной средней к генеральному параметру.

8. Медиана (median, Me, Md) – значение признака, которое делит вариационный ряд пополам. Для определения медианы вручную требуется проранжировать значение признака. Место медианы (median location) определяется по формуле: Меloc = (n+1)/2 = 0,5(n+1)

9. Квартили (quartiles) – три значения признака, которые делят весь вариационный ряд на 4 равные части, содержащие по 25% всех выборочных результатов. Первая квартиль (слово женского рода) – Q1 – это отметка, отделяющая первые 25% всех результатов, начиная с наименьшего; вторая квартиль Q2 соответствует медиане и отделяет 50% результатов, третья квартиль (Q3) отделяет 75% результатов. Самый простой способ даёт приближённое расположение квартилей и напоминает нахождение медианы:

Q1, Q3 (location) = 0,5(nMe + 1)

Здесь ­nMe – количество измерений, лежащих слева или справа от медианы. Как и в случае медианы, формула рассчитывает не само значение квартилей, а их положение в вариационном ряду. Полученный порядковый номер результата для Q1 нужно отсчитывать от начала вариационного ряда, а порядковый номер результата для Q3 – с конца.

10. Процентили (percentile, percentage, P). Процентиль (иногда пишут "перцентиль") можно определить как сумму накопленных частот результатов выборки (от минимального до результата конкретного испытуемого), выраженную в процентах. Другими словами, процентиль результата конкретного испытуемого определяется процентом лиц в выборке, имеющих результат меньший или равный результату данного испытуемого. Поэтому процентиль рассчитывается как частное порядкового номера результата испытуемого в вариационном ряду (№) к общему количеству измерений (n):

P = [№ / n] ´ 100%

11. Мода (mode, Mo) – значение признака, которое встречается чаще всех остальных, т.е. имеет max абсолютную частоту. Так, если за экзамен большинство членов группы получили на экзамене оценку «хорошо» (4), значит, Мо = 4.

13. К описательной статистике относятся также величины асимметрии (skewness) и эксцесса (kurtosis). Первая величина характеризует симметричность распределения эмпирических данных, вторая – особенности пика (вершины) распределения.

где mА – стандартная ошибка коэффициента асимметрии.

где mЕ – стандартная ошибка коэффициента эксцесса.

Для идеально нормального распределения эмпирические величины асимметрии и эксцесса равны нулю. Если А > 0 в выборке преобладают низкие значения и кривая распределения отклоняется влево; при А < 0 преобладают высокие значения и кривая отклоняется вправо. При Е > 0 вершина кривой распределения сужена и напоминает заострённый шпиль; при Е < 0 вершина «холма» сглажена, а «склоны» пологи.


Пример (Расчёты описательной статистики). Пульс или частота сердечных сокращений (ЧСС) меняется не только под влиянием физических нагрузок, но и психического состояния человека. Группу людей (n = 10), пульс которых в исходном состоянии соответствовал норме (60-90 уд/мин), поместили в зал игровых автоматов на 10 минут, после чего снова подсчитали ЧСС. Рассчитайте описательные характеристики полученных результатов, которые для удобства уже проранжированы: 68, 78, 86, 90, 94, 98, 101, 106, 122, 130.

Рассчитайте показатели описательной статистики самостоятельно. При правильных расчётах цифры должны совпадать с контрольными.

Расчёты: min = 68; max = 130; R = 62; M = 97,3; σ = 18,833; m = 5,955. Далее расчёты немного усложняются. Мода здесь не определяется. В таких случаях её ещё называют множественной. Меloc = (10+1)/2 = 5,5. Это значит, что значение медианы находится ровно посередине между 5 и 6 членами ранжированного ряда, т.е. Ме = 96. Рассчитываем квартили. Слева и справа от Ме лежат по 5 значений пульса, значит Q1,3 = (5+1)/2 = 3. Это значит, что значение первой квартили Q1 будет третьим с начала, а третьей квартили Q3 – третьим с конца. Отсюда Q1 = 86; Q3 = 106.

Рассчитаем вторичные или производные показатели. Коэффициент вариации V = 19,4%; коэффициент точности Cs = 6,1%. Величины асимметрии и эксцесса с их стандартными ошибками составят А = 0,248 ± 0,775 и Е = -1,079 ± 1,549.

Предварительные выводы о ЧСС в условиях игры. Распределение результатов близко к нормальному. Условно "нормальный" пульс имеют около 25% выборки, у остальных 75% наблюдается та или иная степень тахикардии. Значит, пульс у большинства повышен, что связано, видимо, с возбуждением от игровой деятельности. Вместе с тем выраженный разброс результатов и малый объём выборки не позволяют считать полученные данные достаточно надёжными для окончательных выводов.

 





©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.