Корреляционный анализ

Процедура корреляционного анализа предполагает подготовку таблицы данных (называется также матрицей наблюдения), где в первом столбце приводятся коды или фамилии испытуемых, а последующие столбцы содержат значения зарегистрированных признаков. В качестве примера можно взять Таблицу данных из Приложения.

Дальнейший этап – составление матрицы интеркорреляций. При этом исходные данные должны быть измерены в метрических шкалах. Так, результаты первых трех параметров в нашей таблице представлены в номинативной шкале и обработке не подлежат. В указанной процедуре используется формула линейной корреляции с целью вычисления сопряженности требуемых пар признаков. Например, для показателей субтестов «осведомленность» и «скрытые фигуры» значение коэффициента R_xy = 0,28. Вручную обработка матрицы занимает очень много времени, поэтому рекомендуется для этой цели использовать компьютерные программы: например, Statistica, SPSS или Excel последних версий.

В нашем случае в результате вычислений матрица принимает следующий вид:

	осведомленность	скрытые фигуры	пропущенные слова	арифметика	понятливость	исключение изображений	аналогии	числовые ряды	умозаключения	геометрическое сложение	заучивание слов	средний IQ	экстраверсия-интроверсия	нейротизм	средняя отметка
Осведомленность		0,28	0,37	0,18	0,15	0,29	0,25	0,16	0,01	0,03	0,45	0,47	0,14	-0,03	0,40
Скрытые фигуры	0,28		0,34	0,21	0,36	0,38	0,23	0,23	0,26	0,49	0,15	0,63	0,11	0,13	0,42
Пропущенные слова	0,37	0,34		0,23	0,20	0,34	0,31	0,30	0,38	0,18	0,43	0,65	0,14	-0,05	0,33
Арифметика	0,18	0,21	0,23		0,19	0,17	0,54	0,51	0,38	0,39	-0,04	0,57	-0,13	0,06	0,23
Понятливость	0,15	0,36	0,20	0,19		0,35	0,18	0,04	0,25	0,34	0,24	0,51	-0,02	-0,01	0,31
Исключение изображений	0,29	0,38	0,34	0,17	0,35		0,18	0,25	0,23	0,19	0,32	0,57	0,09	-0,02	0,35
Аналогии	0,25	0,23	0,31	0,54	0,18	0,18		0,42	0,56	0,26	0,07	0,66	-0,04	-0,06	0,38
Числовые ряды	0,16	0,23	0,30	0,51	0,04	0,25	0,42		0,38	0,28	0,17	0,61	-0,17	0,29	0,38
Умозаключения	0,01	0,26	0,38	0,38	0,25	0,23	0,56	0,38		0,40	-0,01	0,64	0,02	-0,03	0,22
Геометрическое сложение	0,03	0,49	0,18	0,39	0,34	0,19	0,26	0,28	0,40		-0,11	0,56	0,20	0,36	0,19
Заучивание слов	0,45	0,15	0,43	-0,04	0,24	0,32	0,07	0,17	-0,01	-0,11		0,40	0,15	0,05	0,34
Средний IQ	0,47	0,63	0,65	0,57	0,51	0,57	0,66	0,61	0,64	0,56	0,40		0,08	0,11	0,57
Экстраверсия- -интроверсия	0,14	0,11	0,14	-0,13	-0,02	0,09	-0,04	-0,17	0,02	0,20	0,15	0,08		-0,02	0,09
Нейротизм	-0,03	0,13	-0,05	0,06	-0,01	-0,02	-0,06	0,29	-0,03	0,36	0,05	0,11	-0,02		-0,04
Средняя отметка	0,40	0,42	0,33	0,23	0,31	0,35	0,38	0,38	0,22	0,19	0,34	0,57	0,09	-0,04

Поскольку таблица симметрична относительно диагонали, нижнюю часть матрицы можно не печатать. Отдельный фрагмент матрицы интеркорреляции, когда по горизонтали представлены одни признаки, а по вертикали – другие, можно называть корреляционной матрицей.

Следующий этап заключается в маркировке соответствующим числом звездочек тех значений коэффициентов, которые статистически значимо отличаются от нуля (р £ 0,05, 0,01, 0,001). Можно также для обозначения разных уровней достоверности использовать фломастеры разного цвета. После данной процедуры таблица будет выглядеть следующим образом:

	осведомленность	скрытые фигуры	пропущенные слова	арифметика	понятливость	исключение изображений	аналогии	числовые ряды	умозаключения	геометрическое сложение	заучивание слов	средний IQ	экстраверсия-интроверсия	нейротизм	средняя отметка
Осведомленность		0,28	0,37^*	0,18	0,15	0,29	0,25	0,16	0,01	0,03	0,45^**	0,47^***	0,14	-0,03	0,40^**
Скрытые фигуры			0,34^*	0,21	0,36^*	0,38^**	0,23	0,23	0,26	0,49^***	0,15	0,63^***	0,11	0,13	0,42^**
Пропущенные слова				0,23	0,20	0,34^*	0,31^*	0,30^*	0,38^**	0,18	0,43^**	0,65^***	0,14	-0,05	0,33^*
Арифметика					0,19	0,17	0,54^***	0,51^***	0,38^**	0,39^**	-0,04	0,57^***	-0,13	0,06	0,23
Понятливость						0,35^*	0,18	0,04	0,25	0,34^*	0,24	0,51^***	-0,02	-0,01	0,31^*
Исключение изображений							0,18	0,25	0,23	0,19	0,32^*	0,57^***	0,09	-0,02	0,35^*
Аналогии								0,42^**	0,56^***	0,26	0,07	0,66^***	-0,04	-0,06	0,38^**
Числовые ряды									0,38^**	0,28	0,17	0,61^***	-0,17	0,29^*	0,38^**
Умозаключения										0,40^**	-0,01	0,64^***	0,02	-0,03	0,22
Геометрическое сложение											-0,11	0,56^***	0,20	0,36^**	0,19
Заучивание слов												0,40^**	0,15	0,05	0,34^*
Средний IQ													0,08	0,11	0,57^***
Экстраверсия- -интроверсия														-0,02	0,09
Нейротизм															-0,04
Средняя отметка

Затем следует построение корреляционного графа. На чертеже представляются отдельные качества, измеренные субтестами, при этом коррелирующие качества соединяются линиями. Рекомендуются употреблять следующие типы линий:

	r > 0	r < 0
0,1
0,05
0,01
0,001

Фрагмент графа называется корреляционной плеядой.

Ниже дан пример корреляционных графов, демонстрирующих структурированность лингвистических способностей у студентов, характеризующихся высоким (слева) и низким (справа) уровнем обучаемости (данные получены по результатам исследования проведенного автором).

Условные обозначения:

1 – Общая обучаемость иностранному языку

2 – Вербальная оперативная память

3 – Способность к установлению языковой закономерности

4 – Способность к вероятностному прогнозированию

5 – Слуховая дифференциальная чувствительность

Факторный анализ

Матрица наблюдений может содержать несколько сотен строк, в соответствии с числом наблюдаемых объектов. В этом случае корреляционный анализ, ввиду больших размеров, становится неэффективным. Возникает потребность «ужать» информацию и описать явление малым числом обобщающих факторов, которые непосредственно не наблюдаются, но характеризуют явление. Такое свертывание информации и выделение главных факторов реализуется методами факторного анализа. Методика его проведения вручную в данном пособии не приводится, так является весьма трудоемкой процедурой. Для проведения анализа рекомендуется использовать компьютерные программы, такие как Statistica, Stadia или SPSS.

Чтобы выявить главные факторы, скрытые в исходной таблице данных, вначале строится матрица интеркорреляции. Затем методами линейной алгебры исследуется внутренняя структура матрицы и определяются главные факторы, так, чтобы первый из них вносил максимальный вклад в дисперсию признаков, второй - максимальный вклад в дисперсию признаков, оставшуюся после учета главного фактора и т.д.

Таблица данных должна содержать по меньшей мере столько же строк (объектов), сколько и столбцов (зафиксированных признаков). А в идеале, чем больше объектов исследовано, тем надежнее получатся результаты.

Пример подобной матрицы данных приведен ниже.

№	Мотивация успеха – избегания неудач	Величина IQ	Стиль учебной деятельности	Нейротизм	Самооценка	Дисциплина	Физическое здоровье	Общая успеваемость





n

Факторный анализ поможет выявить причины уровня общей успеваемости в зависимости от представленных левее тестовых показателей. То есть решается следующее уравнение:

Общ.усп. =k₁*МУН + k₂*IQ + k₃*СУД + k₄*нейр-м + k₅*самооценка + k₆*дисц + k₇*физ.зд.

При проведении анализа матрицы наблюдений, взятой из Приложения, мы получаем следующую картину.

	Фактор 1	Фактор 2
Осведомленность	0,011131	0,702881
Скрытые фигуры	0,417273	0,48626
Пропущенные слова	0,274693	0,64727
Арифметика	0,748789	0,057049
Понятливость	0,284776	0,425368
Исключение изображений	0,220683	0,609239
Аналогии	0,673079	0,235562
Числовые ряды	0,672762	0,17784
Умозаключения	0,711571	0,137342
Геометрическое сложение	0,6856	0,074793
Заучивание слов	-0,16754	0,758415
Средний IQ	0,739398	0,665014
Экстраверсия-интроверсия	-0,16457	0,313332
Нейротизм	0,283054	-0,12875
Средняя отметка	0,291898	0,625413

Серьезной проблемой факторного анализа после определения вкладов главных факторов, является их интерпретация, то есть описание их физического смысла.

Мы видим, что первый фактор проявляет в себя арифметических способностях, способности к умозаключению, показателях экстраверсии (отрицательная корреляция!), пространственного мышления и общих значениях интеллекта. Второй фактор - проявляется в осведомленности и способности к заучиванию слов. Первый фактор следует интерпретировать как способность к сосредоточению и умению решать интеллектуальные задачи, второй по значимости фактор – как хорошая память и умение пользоваться усвоенной ранее информацией.

В истории психологии факторный анализ связан с решением ряда теоретических задач в области исследования интеллекта. Ф. Гальтон, сформулировавший основные идеи метода, пытался при помощи его доказать, что высокий уровень мыслительных способностей является полностью врожденным явлением. Ч. Спирмен, разработавший математическое обоснование данного метода, на основе анализа корреляций между результатами различных тестов выдвинул идею единого генерального фактора, лежащего в основе успешности выполнения любых тестов, связанных с измерением интеллектуальных свойств. А Л. Терстоун разработал концепцию мультифакторного анализа и при его помощи обосновал свою теорию интеллекта.

В настоящее время факторный анализ широко используется как для решения исследовательских задач, так и при конструировании психодиагностических методик. Факторный анализ является важнейшим инструментом для математического моделирования.

Следует отметить, что математическое моделирование – это процедура описания различных процессов (экономических, биологических, социально-психологических) посредством математического аппарата. Указанная процедура включает в себя выделение всех факторов процесса, определение доли вклада каждого из факторов, выявление закономерностей их функционирования и вероятностное предсказание протекания всего процесса в дальнейшем.

Кластерный анализ

Кластерный (таксономический) анализ используется с целью упорядочивания объектов и объединения их в однородные разряды. В результате исходная выборка объектов разделяется на группы схожих между собой объектов, называемых кластерами. Кластер – это группа объектов, характеризующихся повышенной плотностью (сгущенность внутри разряда) и дисперсией.

Результаты процедуры представляются графически в виде дендрограммы – древовидного графика. Алгоритм проведения данного вида анализа в настоящем пособии не рассматривается, так как, во-первых, это выходит за рамки изучаемого курса, а во-вторых, подобная задача легко может быть выполнена при помощи доступных статистических программ (в первую очередь это Statistica и SPSS).

Ниже в качестве примера приведен результат кластерного анализа показателей из Таблицы данных. Для обработки взяты первые 10 человек и рассмотрены показатели их интеллекта, экстраверсии-интроверсии, нейротизма и средней отметки. По горизонтальной шкале отложены личные номера оптантов, как они приведены в таблице. Лица принадлежащие к одному кластеру обладают наибольшей степенью близости исследуемых параметров. С начала в единый кластер объединяются 2 объекта с наиболее близкими показателями (№ 3 и 2, 8 и 6, 10 и 4, 5 и 1 ). Затем к кластеру присоединяется еще один объект с похожими параметрами (9 объединяется с кластером 5-1), потом следующий и так до конца.

⇐ Предыдущая 15 16 17 18 19 202122 23 24 Следующая ⇒