Частотный анализ данных. Лабораторная работа в системе STATISTICA.
Часть 2. Описательные статистики. Частотный анализ данных. Лабораторная работа в системе STATISTICA. зАДАНИЯ: Найти основные статистики по данным взятым из файла data.sta, предварительно удалив строку равную номеру варианта. Проанализировать полученные результаты. Провести частотный анализ одного набора данных с номером равным номеру варианта. Построить гистограмму по результатам частотного анализа. Проанализировать полученные результаты. Провести частотный анализ двух наборов данных. Построить трехмерную гистограмму двухмерного распределения. Проанализировать полученные результаты.
По данной выборке произведено вычисление основных описательных статистик для двух признаков (среднее значение, медиана, мода, частота, сумма, минимум, максимум, размах, дисперсия, асимметрия, эксцесс) для Y3 и X7 – индекс снижения себестоимости продукции и среднегодовая стоимость ОПФ соответственно.
Вывод: Описательная статистика включает в себя несколько базовых показателей, которые можно разделить на три основных группы: показатели положения и показатели разброса. В целом описательные статистики характеризуют положение выборки относительно числовой прямой, а также форму ее распределения. Описательные статистики дают нам возможность оценить характер распределения данных в изучаемой выборке. На основании этой оценки мы можем принять решение о том какие критерии надлежит использовать в дальнейшей работе - например при сравнении выборок. Описательные статистики являются основой построения статистических графиков и диаграмм - например диаграмм размаха, т.е. являются предварительным этапом в проведении визуального анализа данных. Таким образом, можно отнести их к категории разведочных методов анализа данных. Проанализировав полученные данные, можно предположить, что распределение этих величин далеко от нормального распределения. Об этом свидетельствуют большая разница значений среднего арифметического, медианы и моды; широкий размах, большие значения коэффициентов асимметрии и эксцесса. Положительные и отрицательные коэффициенты асимметрии, а также только отрицательные значения эксцесса указывают на то, что привнос рентабельности значительно превышает интенсивность коэффициента сменности оборудования.
Далее приведены таблицы частотного анализа для переменных:
Для того, чтобы наглядно увидеть результаты частотного анализа, построим гистограмму частотного анализа. Для этого нажимаем ГИСТОГРАММА
Вывод: Анализируя таблицу частот для коэффициента сменности оборудования, мы можем сказать, что треть часть оборудований (а это 7, что составляет 29,17 % от общего количества оборудований) имеют индекс снижения сменности оборудования в интервале от 0 до 100.
На гистограмме частотного анализа для рентабельности Y3видно, что наибольшую высоту имеет столбец, равный 10, а на графике коэффициента сменности оборудованияX7видно, что высота равна 9, что имеет незначительное различие. Также по гистограмме можно убедиться в том, что график распределения имеет острую вершину и правостороннюю асимметрию (а это смещение влево относительно нормального распределения)
Нормальное распределение данных - весьма распространенное явление. Оно наблюдается тогда, когда на результат влияет множество факторов и ни один из них нельзя назвать решающим. В таком случае мы наблюдаем характерную картину, когда результаты, близкие к среднему арифметическому встречаются чаще всего, а чем больше отличается результат от среднего, тем менее вероятно его появление. Именно к таким распределениям данных и подходит (становится осмысленным и полезным) среднее арифметическое и стандартное отклонение от него . Вывод: На данной гистограмме частотного анализа мы видим, что наибольшую высоту имеет столбец, соответствующий подинтервалу от 0 до 10, а его высота оказалась равной 10 (переменная Y3-рентабельность), а наименьшее значение имеет КОЭФФИЦИЕНТ сменности оборудования,который соответствует интервалу от 0 до 10, а его высота равна 9. Сравнивая эти 2 графика, можно придти к выводу о том, что число наблюдений рентабельности больше, чем коэффициент сменности оборудования Проведем частотный анализ двух наборов данных и построим трехмерную гистограмму, который отображает одновременно два набора данных. В качестве этих наборов данных рассмотрим переменную Y3 и X7. Вывод: 3М гистограмма двух переменных. Трехмерные гистограммы используются для визуализации сопряженности значений двух переменных X7 и Y3. Их можно рассматривать как соединение двух простых гистограмм (т.е. гистограмм одной переменной); они соединены таким образом, что можно анализировать частоты совместного появления значений двух исследуемых переменных. В наиболее часто используемом формате этого графика для каждой ячейки таблицы сопряженности рисуется 3М столбец, и высота этого столбца представляет собой частоту значений для соответствующей клетки таблицы. Анализируя внешний вид гистограммы можно сделать вывод о том, что у большинства наблюдений коэффициент сменности оборудований лежит в интервале (25;150)
©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|