Здавалка
Главная | Обратная связь

Однофакторный дисперсионный анализ



 

Для сравнения влияния факторов на результативный признак необходим определенный статистический материал – каждому уровню фактора должна соответствовать определенная выборка значений результативного признака. Статистический материал удобно представлять в виде таблицы 2.1.

 

Т а б л и ц а 2.1

Матрица экспериментов для однофакторного анализа

Уровни фактора Номер выборки
Значения результативного признака  
Объем выборки  

 

Общее число наблюдений .

Прежде чем судить о количественном влиянии фактора, необходимо установить наличие такого влияния. Возможно, расхождение значений результативного признака для различных уровней фактора объясняется действием чистой случайности.

На статистическом языке это предположение означает проверку однородности всех выборок таблицы 2.1, т.е. проверку принадлежности всех значений результативного признака одной генеральной совокупности. Основной процедурой дисперсионного анализа является проверка этой гипотезы с помощью статистических критериев.

Основная идея однофакторного дисперсионного анализа заключается в сравнении дисперсии исследуемого признака, вызванной действием фактора, с дисперсией ошибок измерения этого признака. Если различие между ними значимо, то фактор оказывает существенное влияние на исследуемый признак.

Пусть фактор имеет различных уровней, на каждом из которых выполнено наблюдений. Следовательно, наблюдалось значений признака (свойства) , где - номер наблюдения ( ), - номер уровня фактора ( ).

Дисперсионный анализ основан на предположении об однородности рядов измерений, нормальном распределении и независимости этих рядов.

Чем существеннее влияние фактора на признак , тем сильней будут различаться между собой средние значения групп наблюдений на разных уровнях фактора .

Существуют понятия:

· общая сумма квадратов - сумма квадратов отклонений всех возможных значений признака от их общего среднего значения

; (2.1)

· сумма квадратов между группами или по факторам - взвешенная сумма квадратов отклонений средних значений по группам от общего среднего значения

; (2.2)

· сумма квадратов внутри групп - сумма квадратов отклонений возможных значений признака каждой группы (уровня фактора) от среднего значения этой группы

, (2.3)

где - соответственно среднее значение группы и общее среднее значение результативного признака, определяемые по формулам

. (2.4)

Для оценки влияния фактора следует разложить общую сумму квадратов на составляющие: сумму квадратов между группами (по факторам) и сумму квадратов внутри групп. Следовательно,

. (2.5)

Сумма отражает влияние на результативный признак уровней фактора, а сумма - влияние погрешностей измерений. Так как , то сумму называют еще остаточной суммой квадратов.

Суммы квадратов , , , деленные на соответствующие числа степеней свободы, дают три несмещенные оценки дисперсии генеральной совокупности:

; (2.6)

(2.7)

(2.8)

Первая оценка называется общей оценкой дисперсии (или выборочной дисперсией), вторая – оценкой дисперсии по факторам (оценкой дисперсии между группами или факторной дисперсией) и третья – остаточной оценкой дисперсии (оценкой дисперсии внутри групп или остаточной дисперсией).

Число степеней свободы представляет собой число независимых отклонений значений признака от его среднего значения. Сумма имеет = степень свободы, так как из отклонений групповых средних от общей средней независимых будет ( ), а последнее отклонение выражается через все предыдущие. Сумма имеет = ( ) ( ) степеней свободы, так как вычисляется по отклонениям наблюдений от средних. Число степеней свободы проверяется путем сложения тем же способом, что и сумма квадратов (2.5), т.е. = .

Если факторная дисперсия окажется меньше остаточной , то фактор оказывает несущественное влияние на признак .

Проверка значимости оценок дисперсии выполняется с помощью – критерия Фишера, расчетное значение которого определяется дисперсионным отношением

= / при > . (2.9)

Если расчетное значение критерия окажется меньше критического, то нет оснований считать, что рассматриваемый фактор влияет на изменчивость средних значений случайной величины. Если , то на принятом уровне значимости делается вывод о существенном влиянии фактора на признак .

После того как выполнена оценка влияния фактора на изменчивость средних значений случайной величины в целом и установлено, что фактор влияет на изменчивость средних значений, то переходят к подробному исследованию отдельных уровней фактора. Для этого проводится оценка расхождения средних значений, полученных при наблюдениях по отдельным уровням фактора.

Для сравнения двух выборочных средних используют - статистику. Вычисляют общую дисперсию двух выборок и расчетное значение - статистики по формулам:

(2.10)

. (2.11)

Критическое значение - статистики определяется с помощью статистической функции СТЬЮДРАСПОБР. Число степеней свободы . Гипотеза о равенстве выборочных средних подтверждается, если . Если , то уровень фактора с большим средним значением оказывает существенное влияние на исследуемый признак.

Рассмотрим методику однофакторного дисперсионного анализа и возможные результаты на конкретных примерах.

Пример 2.1[5].Две группы дилеров продают автомобили, которые рекламируются соответственно рекламами и . Третья группа дилеров работает без рекламы. В каждой группе задействовано по 4 дилера. Таким образом, =3, =4.

В таблице 2.2 приведено количество автомобилей, которые проданы различными группами дилеров.

 

Т а б л и ц а 2.2

Сводка исходных данных

Дилер Реклама А Реклама В Рекламы нет

Требуется определить влияние двух видов рекламы на объем продаж автомобилей.

Результаты расчета в среде ЭТ приведены в таблице 2.3., расчетные формулы – в таблице 2.4.

Для пояснения методики однофакторного дисперсионного анализа выполнен контрольный расчет.

 

Контрольный расчет

1. Вычисляем групповые и общее средние значения:

2. Составляем сумму квадратов отклонений групповых средних значений от общего среднего значения

=4((54-56)2+(66-56)2+(48-56)2)=672.

 

Т а б л и ц а 2.3

Результаты расчета в среде ЭТ

 

 

3. Составляем сумму квадратов отклонений наблюдавшихся значений каждой группы от среднего значения своей группы

=((51-54)2+(52-54)2+(56-54)2+(57-54)2)+…+

+((42-48)2+(48-48)2+(50-48)2+(52-48)2)=122.

4. Находим факторную и остаточную дисперсии

= /( -1)=672/2=336; = /( ( -1))=122/9=13,55, .

5. Сумма квадратов общей изменчивости объема продаж равна =794, число степеней свободы =11, оценка общей или выборочной дисперсии =72,18.

6. Определяем расчетное значение - критерия

= / =336/13,55=24,786.

7. C помощью статистической функции РАСПОБР находим критическое значение - критерия при . .

Так как , то влияние рекламы на объем продаж статистически значимо (существенно).

Сравнивая результаты расчета в среде ЭТ с контрольным расчетом, отмечаем их совпадение.

 

Т а б л и ц а 2.4

Расчетные формулы

Адрес Формула Адрес Формула
B8 =СУММ(b4:b7)/$b$23 A15 =b4-b$8
E8 =СУММ(b8:d8)/a23 D15 =a15^2
B9 =b8-$e$8 D19 =СУММ(d15:d18)
B10 =b9^2 G19 =СУММ(d19:f19)
E10 =СУММ(b10:d10) G21 =g19/c25
E11 =b23*e10 F24 =e12/g21
E12 =e11/b25 F25 =FРАСПОБР(a25;b25;c25)
D20 =d19/($b$23-1) B25 =a23-1
D23 =(d20+$f$20)/2 C25 =a23*(b23-1)
D25 =b25+c25 G20 =СУММ(d20:f20)
A27 =CТЬЮДРАСПОБР(a25;c25) B27 =(b8-$d$8)*КОРЕНЬ(2)/ КОРЕНЬ($g$21)
F10 =e11+g19 G23 =f20/g20
F12 =f10/d25 M9 =СУММ(m6:m8)
N7 =m8/m9    

 

В таблице 2.5 приведена сводка дисперсионного анализа влияния рекламы на объем продаж автомобилей, полученная с помощью инструмента Однофакторный дисперсионный анализпакета анализа. Диалоговое окно инструмента «Однофакторный дисперсионный анализ» приведено на рис. 2.1.

 

Т а б л и ц а 2.5

Дисперсионный анализ влияния рекламы на объем продаж

 

 

В таблице 5 обозначено: - суммы квадратов; - степени свободы; - дисперсии; - расчетное значение - критерия Фишера; - значение. Если < =0,05, то исследуемый фактор статистически значим. Дополнительно выполнена проверка однородности дисперсий ошибок измерений.

 







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.