Здавалка
Главная | Обратная связь

Частотный анализ данных. Лабораторная работа в системе STATISTICA.

Часть 2.

Описательные статистики.

Частотный анализ данных. Лабораторная работа в системе STATISTICA.

зАДАНИЯ:

Найти основные статистики по данным взятым из файла data.sta, предварительно удалив строку равную номеру варианта. Проанализировать полученные результаты.

Провести частотный анализ одного набора данных с номером равным номеру варианта. Построить гистограмму по результатам частотного анализа. Проанализировать полученные результаты.

Провести частотный анализ двух наборов данных. Построить трехмерную гистограмму двухмерного распределения. Проанализировать полученные результаты.

  Y1 Y2 Y3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 Х15 X16 X17
9,26 204,20 13,26 0,23 0,78 0,40 1,37 1,23 0,23 1,45 26006,00 167,69 47750,00 6,40 166,32 10,08 17,72
9,38 209,60 10,16 0,24 0,75 0,26 1,49 1,04 0,39 1,30 23935,00 186,10 50391,00 7,80 92,88 14,76 18,39
12,11 222,60 13,72 0,19 0,68 0,40 1,44 1,80 0,43 1,37 22589,00 220,45 43149,00 9,76 158,04 6,48 26,46
10,81 236,70 12,85 0,17 0,70 0,50 1,42 0,43 0,18 1,65 21220,00 169,30 41089,00 7,90 93,96 21,96 22,37
9,35 62,00 10,63 0,23 0,62 0,40 1,35 0,88 0,15 1,91 7394,00 39,53 14257,00 5,35 173,88 11,88 28,13
9,87 53,10 9,12 0,43 0,76 0,19 1,39 0,57 0,34 1,68 11586,00 40,41 22661,00 9,90 162,30 12,60 17,55
8,17 172,10 25,83 0,31 0,73 0,25 1,16 1,72 0,38 1,94 26609,00 102,96 52509,00 4,50 88,56 11,52 21,92
9,12 56,50 23,39 0,26 0,71 0,44 1,27 1,70 0,09 1,89 7801,00 37,02 14903,00 4,88 101,16 8,28 19,52
6,30 46,60 10,05 0,36 0,73 0,39 1,25 0,60 0,21 2,06 9475,00 40,07 16821,00 3,60 140,76 32,40 21,76
6,22 53,20 13,99 0,37 0,68 0,33 1,13 0,82 0,42 1,96 10811,00 45,44 19459,00 3,56 128,52 11,52 25,68
5,49 30,10 9,68 0,43 0,74 0,25 1,10 0,84 0,05 1,02 6371,00 41,08 12973,00 5,65 177,84 17,28 18,13
6,50 146,40 10,03 0,35 0,66 0,32 1,15 0,67 0,29 1,85 26761,00 136,14 50907,00 4,28 114,48 16,20 25,74
6,61 18,10 9,13 0,38 0,72 0,02 1,23 1,04 0,48 0,88 4210,00 42,39 6920,00 8,85 93,24 13,32 21,21
4,32 13,60 5,37 0,42 0,68 0,06 1,39 0,66 0,41 0,62 3557,00 37,39 5736,00 8,52 126,72 17,28 22,97
7,37 89,80 9,86 0,30 0,77 0,15 1,38 0,86 0,62 1,09 14148,00 101,78 26705,00 7,19 91,80 9,72 16,38
7,02 62,50 12,62 0,32 0,78 0,08 1,35 0,79 0,56 1,60 9872,00 47,55 20068,00 4,82 69,12 16,20 13,21
8,25 46,30 5,02 0,25 0,78 0,20 1,42 0,34 1,76 1,53 5975,00 32,61 11487,00 5,46 66,24 24,84 14,48
8,15 103,50 21,18 0,31 0,81 0,20 1,37 1,60 1,31 1,40 16662,00 103,25 32029,00 6,20 67,68 14,76 13,38
8,72 73,30 25,17 0,26 0,79 0,30 1,41 1,46 0,45 2,22 9166,00 38,95 18946,00 4,25 50,40 7,56 13,69
6,64 76,60 19,40 0,37 0,77 0,24 1,35 1,27 0,50 1,32 15118,00 81,32 28025,00 5,38 70,56 8,64 16,66
8,10 73,01 21,00 0,29 0,78 0,10 1,48 1,58 0,77 1,48 11429,00 67,26 20968,00 5,88 72,00 8,64 15,06
5,52 32,30 6,57 0,34 0,72 0,11 1,24 0,68 1,20 0,68 6462,00 59,92 11049,00 9,27 97,20 9,00 20,09
9,37 199,60 14,19 0,23 0,79 0,47 1,40 0,86 0,21 2,30 24628,00 107,34 45893,00 4,36 80,28 14,76 15,98
13,17 598,10 15,81 0,17 0,77 0,53 1,45 1,98 0,25 1,37 49727,00 512,60 99400,00 10,31 51,48 10,08 18,27

 

По данной выборке произведено вычисление основных описательных статистик для двух признаков (среднее значение, медиана, мода, частота, сумма, минимум, максимум, размах, дисперсия, асимметрия, эксцесс) для Y3 и X7 – индекс снижения себестоимости продукции и среднегодовая стоимость ОПФ соответственно.

 

Описательные статистики (Мои данные)
  N набл. Среднее Медиана Мода Частота Сумма Минимум Максимум Размах Дисперс. Стд.откл. Асимметрия Эксцесс
Y3 13,66792 12,73500 Множест. 328,0300 5,020000 25,83000 20,81000 36,44531 6,036995 0,691068 -0,448130
X7 1,33292 1,37000 1,350000 31,9900 1,100000 1,49000 0,39000 0,01297 0,113883 -0,720222 -0,582115

 

Вывод: Описательная статистика включает в себя несколько базовых показателей, которые можно разделить на три основных группы: показатели положения и показатели разброса. В целом описательные статистики характеризуют положение выборки относительно числовой прямой, а также форму ее распределения.

Описательные статистики дают нам возможность оценить характер распределения данных в изучаемой выборке. На основании этой оценки мы можем принять решение о том какие критерии надлежит использовать в дальнейшей работе - например при сравнении выборок. Описательные статистики являются основой построения статистических графиков и диаграмм - например диаграмм размаха, т.е. являются предварительным этапом в проведении визуального анализа данных. Таким образом, можно отнести их к категории разведочных методов анализа данных.

Проанализировав полученные данные, можно предположить, что распределение этих величин далеко от нормального распределения. Об этом свидетельствуют большая разница значений среднего арифметического, медианы и моды; широкий размах, большие значения коэффициентов асимметрии и эксцесса. Положительные и отрицательные коэффициенты асимметрии, а также только отрицательные значения эксцесса указывают на то, что привнос рентабельности значительно превышает интенсивность коэффициента сменности оборудования.

 

Далее приведены таблицы частотного анализа для переменных:

Таблица частот: Y3: Рентабельность (Мои данные) K-С d=,17388, p> .20;Лиллиефорса p<,10
  Частота Кумул. Процент Кумул. % % всех Кумул. %
0,000000<x<=5,000000 0,00000 0,0000 0,00000 0,0000
5,000000<x<=10,00000 29,16667 29,1667 29,16667 29,1667
10,00000<x<=15,00000 41,66667 70,8333 41,66667 70,8333
15,00000<x<=20,00000 8,33333 79,1667 8,33333 79,1667
20,00000<x<=25,00000 12,50000 91,6667 12,50000 91,6667
25,00000<x<=30,00000 8,33333 100,0000 8,33333 100,0000
Пропущ. 0,00000   0,00000 100,0000

 

Таблица частот: X7: Коэффициент сменности оборудования (Мои данные) K-С d=,22629, p<,01
  Частота Кумул. Процент Кумул. % % всех Кумул. %
1,000000<x<=1,100000 4,16667 4,1667 4,16667 4,1667
1,100000<x<=1,200000 12,50000 16,6667 12,50000 16,6667
1,200000<x<=1,300000 16,66667 33,3333 16,66667 33,3333
1,300000<x<=1,400000 37,50000 70,8333 37,50000 70,8333
1,400000<x<=1,500000 29,16667 100,0000 29,16667 100,0000
Пропущ. 0,00000   0,00000 100,0000
           

 

 

Для того, чтобы наглядно увидеть результаты частотного анализа, построим гистограмму частотного анализа. Для этого нажимаем ГИСТОГРАММА

 

Вывод: Анализируя таблицу частот для коэффициента сменности оборудования, мы можем сказать, что треть часть оборудований (а это 7, что составляет 29,17 % от общего количества оборудований) имеют индекс снижения сменности оборудования в интервале от 0 до 100.

 

На гистограмме частотного анализа для рентабельности Y3видно, что наибольшую высоту имеет столбец, равный 10, а на графике коэффициента сменности оборудованияX7видно, что высота равна 9, что имеет незначительное различие. Также по гистограмме можно убедиться в том, что график распределения имеет острую вершину и правостороннюю асимметрию (а это смещение влево относительно нормального распределения)

 

Нормальное распределение данных - весьма распространенное явление. Оно наблюдается тогда, когда на результат влияет множество факторов и ни один из них нельзя назвать решающим. В таком случае мы наблюдаем характерную картину, когда результаты, близкие к среднему арифметическому встречаются чаще всего, а чем больше отличается результат от среднего, тем менее вероятно его появление. Именно к таким распределениям данных и подходит (становится осмысленным и полезным) среднее арифметическое и стандартное отклонение от него

. Вывод: На данной гистограмме частотного анализа мы видим, что наибольшую высоту имеет столбец, соответствующий подинтервалу от 0 до 10, а его высота оказалась равной 10 (переменная Y3-рентабельность), а наименьшее значение имеет КОЭФФИЦИЕНТ сменности оборудования,который соответствует интервалу от 0 до 10, а его высота равна 9. Сравнивая эти 2 графика, можно придти к выводу о том, что число наблюдений рентабельности больше, чем коэффициент сменности оборудования

Проведем частотный анализ двух наборов данных и построим трехмерную гистограмму, который отображает одновременно два набора данных. В качестве этих наборов данных рассмотрим переменную Y3 и X7.

Вывод: 3М гистограмма двух переменных. Трехмерные гистограммы используются для визуализации сопряженности значений двух переменных X7 и Y3. Их можно рассматривать как соединение двух простых гистограмм (т.е. гистограмм одной переменной); они соединены таким образом, что можно анализировать частоты совместного появления значений двух исследуемых переменных. В наиболее часто используемом формате этого графика для каждой ячейки таблицы сопряженности рисуется 3М столбец, и высота этого столбца представляет собой частоту значений для соответствующей клетки таблицы. Анализируя внешний вид гистограммы можно сделать вывод о том, что у большинства наблюдений коэффициент сменности оборудований лежит в интервале (25;150)

 





©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.