Здавалка
Главная | Обратная связь

Неметрическая модель



Это основной вариант многомерного шкалирования, применяемый в на­стоящее время. Он лежит в основе всех остальных вариантов метода, Исход­ные данные для этого метода - матрица размерностью , каждый элемент которой - мера (оценка) различия между двумя объектами из Р. Рассмотрим кратко основные математико-статистические идеи метода, необходимые для его использования на практике.

Многомерное шкалирование, как новый шаг в математике, начинается с метрического шкалирования, предложенного в 50-х годах У. Торгерсоном. В модели Торгерсона вводится жесткое предполо­жение о том, что оценки различия между объектами равны линейному рас­стоянию между ними в евклидовом пространстве.

Пусть - имеющаяся в распоряжении исследователя оценка различия между объектами и - координаты этих объектов по оси , одной из осей искомого пространства размерностью . Расстояние между объектами в искомом пространстве обозначим как . Тогда основное предположение Тор­герсона можно выразить формулой:

Торгерсон показал, что при соблюдении этого условия возможен переход от исходной матрицы различий между стимулами к их координатам в про­странстве признаков. Тогда, по Торгерсону, справедливо выражение:

или в матричной виде:

где — матрица координат стимулов, размерностью

Это уравнение аналогично главному уравнению факторного анализа, и решается оно относительно методом главных компонент с заданным чис­лом .

В современных алгоритмах МШ метод Торгерсона используется на этапе предварительной оценки координат объектов по матрице исходных разли­чий. Далее следует неметрический этап, соответствующий неметричности ис­ходных данных. На этом этапе исходят из требования соответствия рангово­го порядка расстояний между объектамив результирующем пространстве ранговому порядку исходных различий, то есть, используя принятые обозначения:

для любых - номеров объектов.

Основной мерой выполнения этого требования является специальный по­казатель, который называется стресс - мера отклонения итоговой конфигурации объектов от исходных оценок различияв смысле указанного требования ранго­вого соответствия. Иногда дополнительно применяют коэффициент отчужде­ния тоже как меру подгонки неметрической модели к данным о различии.

Не рассматривая подробно вычислительные проблемы многомерного шка­лирования, укажем, что его алгоритм направлен на нахождение оценок коор­динат объектов, минимизирующих значение стресса. Построен этот алгоритм как градиентная процедура. Первый шаг алгоритма - получение стартовой конфигурации, как правило, методом Торгерсона. На каждом последующем шаге, или итерации, координаты стимулов изменяются в сторону уменьше­ния значения стресса, вычисленного на предыдущем этапе. Итерации повто­ряются многократно, до выполнения одного из трех заданных изначально условий (в программе SPSS): достижения минимального значения стресса; достижения минимальной разницы между последним и предыдущим значе­ниями стресса; выполнения максимального заданного числа итераций. Каж­дое из трех условий задано в программе «по умолчанию», но может изменять­ся пользователем. Уменьшая пороговые величины стресса и его изменения, увеличивая максимальное число итераций, пользователь может добиться по­вышения точности окончательного решения. Показателем точности являет­ся конечная величина стресса. Наиболее приемлемые величины стресса на­ходятся в диапазоне от 0,05 до 0,2.

Одна из основных проблем, возникающих перед исследователем в МШ - это проблема размерности К. Как и при проведении факторного анализа, в М Ш требуется предварительное определение числа шкал. Поэтому от исследо­вателя требуется получить несколько решений в пространствах разной раз­мерности и выбрать из них лучшее. Один из критериев размерности, приме­няемый для предварительной оценки числа шкал, аналогичен критерию отсеивания Кеттелла в факторном анализе: строится график зависимости стресса от числа шкал по результатам решения в разных размерностях. Ис­тинная размерность соответствует точке перегиба графика после резкого его спада.

Другой критерий числа шкал - абсолютная величина стресса. Если реше­ние одномерно, то приемлемая величина стресса - менее 0,1. Если решение размерностью 2 и выше, то приемлемы значения стресса, меньшие 0,1- 0,15. Однако если уровень ошибок измерения или выборки высок, то можно при­знать решение и с более высокими значениями стресса. Дополнительно вы­числяется величина R2 (RSQ), которая показывает долю дисперсии исходных различий (от единичной), учтенную выделенными шкалами. Чем ближе RSQ к единице, тем полнее данные шкалы воспроизводят исходные различия между объектами.

Окончательный выбор размерности решения определяется на основе кри­териев интерпретируемости и воспроизводимости, так же, как в факторном анализе. Тем не менее, при размерности 2 и выше, следует избегать решений с величиной стресса выше 0,2. Обычный путь для этого - повышение раз­мерности и исключение объектов.

Результаты применения метода - таблица координат объектов в простран­стве шкал-признаков, величины стресса и RSQ, интерпретация шкал и вза­имного расположения объектов по таблице координат.

Исследовалась структура представлений студента о многомерных методах, приме­няемых в психологии. Студенту было предложено сравнить попарно по степени различия пять методов: множественный регрессионный анализ (МРА), дискриминантный анализ (ДА), кластерный анализ (КА), факторный анализ (ФА) и много­мерное шкалирование (МШ). При сравнении было предложено использовать 5-балльную шкалу (1 - очень похожи, 5 - совсем разные). Результаты сравнения приведены в табл. 10.

 

 

Таблица 10

 







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.