Здавалка
Главная | Обратная связь

КАКОВА ЦЕНА РЕАЛИЗМА?



До сих пор мы почти не затрагивали этот вопрос. Он обсуждался только в эксперименте с высотомерами, который меньше других был сходен с реальной жизнью. Мы показали, что по используемым приемам этот эксперимент был все-таки довольно удачным (по сравнению с возможным экспериментом на тренажере), но что его можно улучшать и дальше.

Однако обсуждение можно продолжить и поставить вопрос так. Не слишком ли страдает внутренняя валидность эксперимента из-за нашего стремления к большему реализму, лучшему воспроизведению действительности? И можно ли провести эксперимент, обладающий высокой внутренней валидностью, не отказываясь от максимального приближения к реальности?

Подобные вопросы относятся, на самом деле, только к эксперименту с поиском. В эксперименте с посадками самолета применение тренажера гарантировало достаточную внутреннюю валидность. А вот второй эксперимент был чрезмерно реалистичен: он проводился на настоящем катере в настоящем море. В таких условиях, конечно, трудно проконтролировать всевозможные побочные факторы. Но будет ли этот контроль более эффективным, если провести эксперимент в лаборатории, используя что-то вроде тренажера?

Можно было бы заснять движущуюся поверхность моря и затем показывать ее испытуемому на широком экране. Ощущение реальности можно усилить, используя вместо катера качающуюся платформу, вроде тех, что применяются при изучении морской болезни. Однако при этом возникает сразу несколько проблем. Во-первых, киносъемка все равно не обеспечит испытуемому возможность увидеть всю панораму, которую видит перед собой наблюдатель в реальной спасательной операции. Это отклонение особенно значимо для наблюдения невооруженным глазом. А применение панорамной камеры лишь еще больше запутает зрительную картину. Во-вторых, кино не дает полного впечатления пространства. Для наблюдения с биноклем, когда восприятие глубины так или иначе нарушено, это не столь уж большая помеха, а простое наблюдение явно пострадает. Если же вместо кино показывать слайды, то это еще больше удалит испытуемого от реальности. Все изменения морской поверхности и само движение катера будут утеряны. А они могут по-разному влиять на наблюдение с биноклем и без него. Короче говоря, первоначальный вариант эксперимента был не так уж плох. В данном случае эксперимент должен быть высокореалистичным.

Поскольку в этой главе мы вновь рассматривали практические эксперименты, нам следует упомянуть и о финансовой стороне дела. Если для эксперимента нужен корабль (с заранее составленным планом его движения), а также капитан с командой да еще экипаж вертолетов (действия которых должны быть скоординированы), то потребуются, конечно, большие расходы. Проведение эксперимента Крафта и Элворта на тренажере с компьютером стоит, пожалуй, еще дороже. А несколько фотографий и прокат двух магнитофонов для исследования с высотомерами не стоили Лендбургу почти ничего. Понятно, что меньших затрат требуют эксперименты, которым больше недостает реализма. Чаще всего стремление лучше представить в эксперименте реальный мир стоит очень дорого.

КРАТКОЕ ИЗЛОЖЕНИЕ

В этой главе мы обсуждали три эксперимента, которые не дублируют реальный мир, а «улучшают» его. В первом эксперименте проверялась гипотеза о том, что при посадках самолета на постепенно поднимающуюся территорию у пилотов возникает зрительная иллюзия, и поэтому они снижаются слишком резко. Если проводить этот эксперимент в настоящих аэропортах, неизбежно систематическое смешение независимой переменной с различными побочными факторами. Применение тренажера, имитирующего реальный мир, позволило устранить это смешение.

Гипотеза второго эксперимента состояла в том, что при поисковых операциях на море наблюдение невооруженным глазом даст более эффективные результаты, чем наблюдение с биноклем. Если бы этот эксперимент проводился во время реальных спасательных операций, то за любой практически приемлемый юрок было бы собрано лишь небольшое количество данных. Надежность такого эксперимента была бы низкой. Благодаря использованию самодельных муляжей удалось за несколько недель провести эксперимент с достаточным числом проб, повысив тем самым его надежность. В третьем эксперименте сравнивалось качество работы с двумя высотомерами. Гипотеза была следующей: использование новой унифицированной шкалы позволит сократить количество грубых ошибок при определении высоты полета по сравнению со старой шкалой (циферблат с двумя стрелками). Если бы этот эксперимент проводился в реальном полете, то на успешность работы испытуемого с высотомером влияло бы множество побочных факторов. Полученные данные имели бы большой разброс, и это вновь, понизило бы надежность. Применение задачи по снятию показаний с фотографий обеих шкал в установленном темпе позволило значительно сократить несистематическую изменчивость экспериментальных данных.

Таким образом, в искусственных экспериментах можно повысить внутреннюю валидность. Описаны три способа улучшения реального мира, позволяющие это сделать возможным. Первый из них — устранение систематического смешения. Второй — возможность получить необходимое количество данных за более короткий срок и тем самым повысить надежность эксперимента. И третий — сократить несистематическую изменчивость данных и, следовательно, их разброс, что также обеспечивает более высокую надежность.

Но именно потому, что искусственные эксперименты не дублируют реальный мир, возникает вопрос об их внешней валидности. Достаточно ли успешно представлена в этих экспериментах реальность, чтобы можно было считать полученные результаты адекватными? Поскольку искусственные эксперименты ставятся в тех случаях, когда эксперименты с простым дублированием реального мира страдают недостатком внутренней валидности, сравнение с последними не может служить критерием их адекватности. Внешняя валидность трех описанных экспериментов оценивалась путем сравнения с другими (но также искусственными) приемами их проведения. Каждая из составных частей экспериментальной гипотезы: независимая, зависимая и дополнительные переменные — была проверен» нами на соответствие исследуемой реальности.

Достичь в эксперименте соответствия независимой переменной, как правило, довольно просто. Нужно только, чтобы вводимые условия были либо типичными для реальных ситуаций, либо вполне вероятными.

Соответствие зависимой переменной оценивалось по следующим трем пунктам. (1) Соответствует ли работа испытуемого в эксперименте его реальной деятельности? (2) Отражают ли измеряемые . показатели наиболее важные аспекты этой деятельности? (3) Адекватен ли способ представления результатов измерений? Самой важной проблемой оказывается здесь адекватный учет ошибочных ответов испытуемого, имеющих плюсовые и минусовые значения, как, например, переоценка и недооценка высоты полета. Чаще всего применяются два способа представления таких результатов. Один из них позволяет показать преимущественную направленность ошибочных ответов, а другой — определить величину их разброса.

В искусственных экспериментах возникают также вопросы о соответствии дополнительных переменных, стабильных по своему уровню. В целом ряде случаев такие переменные являются ключевыми, и их уровень должен соответствовать реальному миру. Нужно стараться также воспроизводить в эксперименте те дополнительные (по отношению к основной задаче) действия, которые в реальности выполняются одновременно с ней. Кроме того, следует выяснить, как скажется на внешней валидности искусственного эксперимента отсутствие эмоциональной напряженности (которая, как правило, характерна для соответствующих реальных ситуаций). И наконец, следует специально проанализировать последствия предъявления испытуемому всех экспериментальных проб за короткий (сжатый по сравнению с экспериментом, дублирующим реальность) период времени.

Но есть еще один вопрос — какова цена реализма? Каждый раз необходимо проверять, не слишком ли мы усердствуем, добиваясь в экспериментах как можно более точного воспроизведения реальности, и не страдает ли от этого их внутренняя валидность. Такая проверка также проведена путем сравнения с другими возможными приемами эксперимента. В заключение был затронут вопрос о финансовой стоимости искусственного эксперимента с максимальной имитацией реального мира. Иногда эта стоимость так высока, что реальным может оказаться в действительности менее реалистичный эксперимент.

ВОПРОСЫ

1. Почему эксперимент с ночными посадками самолета не мог быть проведен в настоящих аэропортах?

2. В чем состоит основное преимущество эксперимента со спасательным поиском?

3. Приведите пример эксперимента, дублирующего реальный мир, в котором имела бы место чрезмерная несистематическая изменчивость получаемых данных.

4. Перечислите, каким образом в экспериментах, «улучшающих» реальный мир, добиваются большей внутренней валидности, чем в экспериментах, дублирующих реальность.

5. Как вопрос о внешней валидности связан с вопросом о видах безупречного эксперимента, описанных в главе 2?

6. Что имеют в виду, говоря, что решение вопроса о соответствии эксперимента — это проверка соответствия основных составляющих экспериментальной гипотезы?

7. Приведите конкретные примеры соответствующих и несоответствующих способов получения данных для оценки значения зависимой переменной.

8. В связи с тем, что в искусственных экспериментах редко воспроизводятся стрессовые условия реальной жизни, можно ли сделать вывод, что они не могут быть соответствующими?

9. Почему проблема «реалистичности» эксперимента обсуждалась нами на примерах столь различных в этом отношении исследований, как спасательный поиск и сравнение высотомеров?

СТАТИСТИЧЕСКОЕ ПРИЛОЖЕНИЕ: ЧАСТОТНЫЕ РАСПРЕДЕЛЕНИЯВ статистическом приложении к главе 1 значения зависимой переменной (среднее время реакции) для каждого из двух условий, вспышек света (А) или звучаний тона (Б), были представлены в виде гистограммы.

Рис. 3.6. Ось абсцисс — время реакции (по интервалам, в мс.) Ось ординат — частота. Ср — среднее, СО — стандартное отклонение

Более полная картина оценок ВР, полученных в эксперименте, дается распределением частот. Выше такое распределение показано для условия Б (звуковой тон).Мы видим, что в этом распределении каждая оценка представлена не всегда точно, поскольку оценки сгруппированы в классы интервалов: 120—129, 130—139, 140—149 и т. д. Величина всех интервалов в данном случае равна 10 мс.Это та величина, на которую каждый нижний предел увеличивается от интервала к интервалу (например, от 150 до 160—это 10 мс). Число интервалов здесь равно 8; соответственно имеется 8 колонок. Если бы число оценок показателей времени реакции было больше, чем 17, можно было бы использовать несколько большее число интервалов. Например, если бы было 100 проб, число используемых интервалов могло быть 15 или даже 20. При 15 интервалах нижний интервал был бы 120—124, следующий 125—129 и т. д. до 190— 194. В этом случае величина интервала равнялась бы 5 мс.
КАК ПОДГОТОВИТЬ ЧАСТОТНОЕ РАСПРЕДЕЛЕНИЕ Теперь рассмотрим, как было подготовлено данное распределение частот. Во-первых, было принято решение о числе интервалов и величине интервала, а также о нижней и верхней границах. Подобранные интервалы были выписаны в столбик. Затем, начиная с пробы 1, различные показатели времени реакции распределялись по соответствующим интервалам. После этого записывалась частота или число показателей, попавших в данный интервал. Наконец, был составлен график распределения частот, который вы уже видели на рисунке. Высота каждой колонки Х соответствует частоте попадания проб в данный интервал. Все эти операции показаны в первых трех колонках таблицы 3.3.

Таблица 3.3 Вычисления среднего и стандартного отклонения на основе интервальных данных

Интервал Отнесение показателя по интервалам Частоты Средняя точка X Произведение средней MX x X2 Произведение х2 на частоту
190-199 | 194,5 194,5 +31,5 992,25 992,25
180-189 | 184,5 184,5 +21,5 462,25 462,25
170-179 | | | 174,5 523,5 +11,5 132,25 396,75
160-169 |-|-|-| 164,5 822,5 +1.5 2,25 11,25
150-159 |-|-|-| 154,5 772,5 —8,5 72,25 361,25
140-149 | 144,5 144,5 —18,5 342,25 342,25
130-139   134,5 —28,5 812,25
120-129 | 124,5 124,5 —38,5 1482,25 1482,25
      Σ ХВ =2766,5     Σ х2В =4048,25

 







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.