Здавалка
Главная | Обратная связь

Почему эксперимент с ночными посадками самолета не мог быть проведен в настоящих аэропортах?



В чем состоит основное преимущество эксперимента со спасательным поиском?

Приведите пример эксперимента, дублирующего реальный мир, в котором имела бы место чрезмерная несистематическая изменчивость получаемых данных.

Перечислите, каким образом в экспериментах «улучшающих» реальный мир, добиваются большей внутренней валидности, чем в экспериментах, дублирующих реальность.

5. Как вопрос о внешней валидности связан с вопросом о видах безупречного эксперимента, описанных в главе 2?

Что имеют в виду, говоря, что решение вопроса о соответствии эксперимента — это проверка соответствия основных составляющих экспериментальной гипотезы?

Приведите конкретные примеры соответствующих и несоответствующих способов получения данных для оценки значения зависимой переменной.

В связи с тем, что в искусственных экспериментах редко воспроизводятся стрессовые условия реальной жизни, можно ли сделать вывод, что они не могут быть соответствующими?

Почему проблема «реалистичности» эксперимента обсуждалась нами на примерах столь различных в этом отношении исследований, как спасательный поиск и сравнение высотомеров?

Глава 4

В этой главе мы обсудили три новых эксперимента, для каждого из которых, в отличие от ранее описанных, привлекалось большое число испытуемых. Первый эксперимент посвящен способам информирования о ценах на продукты. Экспериментальная гипотеза состояла в том, что прямое сообщение о цене за единицу веса (путем маркировки пакетов) позволит покупателям выбрать более дешевую покупку точнее и быстрее, чем два другие способа: (1) сообщение о весе пакета и его общей цене (текущая практика) и (2) то же плюс использование специального вычислительного устройства. Гипотеза подтвердилась. Первое преимущество эксперимента данного типа по сравнению с индивидуальным экспериментом заключается в том, что его результаты, полученные на выборке испытуемых, распространяются на более обширную популяцию, а не только на поведение отдельного человека.

Во втором эксперименте проверяли гипотезу о том, поможет ли специальная мысленная тренировка улучшить навыки пилотов по выполнению посадочных операций. Было обнаружено, что курсанты, прошедшие такую тренировку, выполняли эти операции лучше тех, кто тренировался лишь по обычной программе. Второе преимущество экспериментов нового типа также связано с наличием большого числа испытуемых. Становится возможным использование схемы эксперимента с межгрупповым сравнением. Эксперимент с мысленной тренировкой (в том виде, в каком он был представлен) требовал применения такой схемы. Схема группы индивидуальных экспериментов, когда каждый испытуемый участвует во всех экспериментальных условиях, здесь просто неосуществима. Один н тот же человек не может овладеть одним и тем же навыком двумя различными путями. Но даже там, где в принципе можно провести ряд индивидуальных экспериментов, как в эксперименте с сообщением о ценах, преимущества остаются за схемой межгруппового сравнения. Здесь устраняются такие источники нарушения внутренней валидности эксперимента, как эффекты последовательности и факторы задачи.

Детально описан третий эксперимент — с двумя методами обучения испанскому языку. Для его проведения было очень важно подобрать две группы испытуемых, сходных по способности изучать испанский. И тогда стало ясно, что эксперимент с межгрупповым сравнением, устраняя некоторые источники нарушения внутренней валидности, порождает еще один. Это — индивидуальные различия испытуемых. Описаны два вида таких различий. Во-первых, это такие очевидные характеристики, как пол, возраст испытуемых, их образование. Сюда же относятся различия, выявляемые с помощью тестов, скажем, на знание слов испанского языка. Кроме того, существуют несистематические различия испытуемых, которые включают как изменчивость, поведения каждого человека, так и отличия в выполнении задания разными людьми. Во всех трех экспериментах с межгрупповым сравнением использовались схемы, устраняющие систематическое смешение независимой переменной с индивидуальными различиями испытуемых. Но если группы, работающие в разных экспериментальных условиях, имеют явные различия, скажем, взяты из разных школ, то такое смешение неизбежно. Надежность эксперимента повышается за счет привлечения большого числа испытуемых и сокращения несистематических вариаций. Последнее обеспечивается тем, что условия работы каждого испытуемого в группе одинаковы, а также путем сокращения разброса данных каждого испытуемого, как описано в главе 2.

Существуют три стратегии составления групп испытуемых, позволяющие уравнять эти группы в отношении изучаемого вида деятельности: случайная стратегия, подбор пар и случайная с выделением слоев. Их иллюстрациями служат три схемы экспериментов с межгрупповым сравнением, в которых все имеющиеся в наличии испытуемые распределяются по группам для каждого из экспериментальных условий. При использовании схемы случайного распределения групп каждый испытуемый может с равной вероятностью попасть в одну из них. При попарном подборе групп испытуемые сначала располагаются по степени выраженности одной из характеристик, связанной с изучаемым видом деятельности. Испытуемые с одинаковой степенью выраженности этой характеристики попадают затем в разные группы. Применение схемы случайного распределения слоев начинают с классификации испытуемых по некоторому значимому признаку, также связанному с деятельностью, которая исследуется в эксперименте. А затем внутри каждого класса, или слоя, проводится случайное распределение по экспериментальным группам. Все три метода устраняют систематическое смешение независимой переменной с индивидуальными различиями испытуемых. Надежность повышается за счет увеличения числа испытуемых. Если основа подбора пар или выделения слоев действительно связана с исследуемой деятельностью, то при одном и том же количестве испытуемых соответствующие стратегии позволяют обеспечить более высокую надежность по сравнению с обычным случайным распределением.

Чтобы результаты эксперимента можно было распространить на интересующую нас популяцию, выборка испытуемых должна быть репрезентативной. Эксперимент полного соответствия (неосуществимый на практике) потребовал бы участия в нем всей популяции. Внешнюю валидность эксперимента можно оценить по тому, насколько близок к этой недостижимой цели метод отбора испытуемых. Хорошо представить популяцию в целом могла бы случайная выборка достаточно большого размера. Однако подходящие условия для такого выбора встречаются редко: часто исследуемая популяция целиком даже не существует в данный момент времени. Самым удачным из описанных исследований был в этом смысле эксперимент с мысленной тренировкой. Здесь можно было применить стратегию случайного выбора к популяции курсантов. Поскольку эксперимент проводился но схеме межгруппового сравнения с исследованием двух условий независимой переменной, использовались две случайные выборки. Здесь случайная стратегия применялась для отбора испытуемых, а не для распределения по группам, это имеет место, когда все имеющиеся в наличии люди должны участвовать в эксперименте. Эта схема называется схемой случайно отобранных групп.

Хотя для эксперимента с мысленной тренировкой было отобрано не очень много испытуемых, выборка успешно представляла изучаемую субпопуляцию, так как индивидуальные различия между курсантами были не слишком велики. Если же исследователь хочет распространить результаты эксперимента за пределы данной популяции, скажем, на курсантов следующих лет, то проблемы внешней валидности станут более серьезными. Возникнет вопрос о соответствии «уровней» субъектных характеристик изучаемой популяции и той популяции, к которой прилагаются полученные результаты.

Связь внешней и внутренней валидности была описана для экспериментов, в которых испытуемые отбираются из популяции. Если способ отбора испытуемых обеспечивает высокую внешнюю валидность (в отношении индивидуальных различий), то тем самым достигается достаточное подобие групп, т.е. повышается внутренняя валидность. Напротив, группы, хорошо уравненные между собой по индивидуальным характеристикам, могут не быть достаточно представительными для исследуемой популяции. Иначе говоря, высокая внутренняя валидность эксперимента не гарантирует его высокой внешней валидности. При использовании схемы индивидуального эксперимента связь между внешней и внутренней валидностыо отсутствует, поскольку та и другая зависят от разных факторов.

Вместе со случайным отбором, так же как и со случайным распределением, можно использовать выделение слоев. Это дает пятую эффективную схему эксперимента с межгрупповым сравнением — послойный случайный отбор. Сначала популяцию разделяют на классы, или слои, а затем внутри каждого слоя применяют случайный отбор. Выделение слоев дает то же преимущество, что и при случайном распределении, если его основание связано с изучаемым видом деятельности.

Когда для эксперимента привлекаются испытуемые, имеющиеся в наличии, будь то «заложники» или добровольцы, есть опасность, что выборка будет недостаточно репрезентативной. Для оценки репрезентативности выборки экспериментатор должен подробно проанализировать ситуацию, а также предвидеть последствия случаев, когда выборка недостаточно представляет популяцию.

ВОПРОСЫ

  1. Чем отличаются возможности обобщения результатов экспериментов, описанных в этой главе, от экспериментов, рассмотренных ранее?
  2. В каких случаях нужно проводить эксперимент с межгрупповым сравнением, а не интраиндивидуальный эксперимент?
  3. Какие источники нарушения внутренней валидности устраняются в эксперименте с межгрупповым сравнением?
  4. Каковы основные источники межиндивидуальных различий?
  5. Почему неправильно проводить эксперимент на уже существующих группах испытуемых, например на ученических группах в разных школах?
  6. Как можно повысить надежность в межгрупповом эксперименте?
  7. В чем отличие двух межгрупповых схем: со случайным распределением по группам и со случайным отбором в группы?
  8. Какова связь внешней и внутренней валидности в экспериментах с межгрупповыми схемами?
  9. Приведите пример эксперимента, в котором хорошо представлена одна популяция и плохо — другая.

Глава 5

Для научного понимания механизмов поведения необходимы эксперименты, в которых выделяется истинная независимая переменная. Проверяемая в них экспериментальная гипотеза касается уже единичной независимой переменной, в отличие от «группы факторов», которая характерна для экспериментов с немедленным практическим применением результатов. В этих новых исследованиях к экспериментальной гипотезе предъявляются более высокие требования, чем это было раньше, поскольку описываемая независимая переменная должна быть «очищена» от других переменных. Эталоном для оценки внутренней валидности такого эксперимента, в котором делаются попытки выделить единичную независимую переменную, является чистый эксперимент. Этот эксперимент представляет собой, прежде всего, идеальный эксперимент, в котором испытуемому одновременно предъявляются два разных условия независимой переменной. Кроме того, он требует, чтобы независимая переменная была единичной, а не сложной и чтобы другие переменные, которые могут влиять на поведение, сохранялись строго постоянными.

Прежде всего мы показали в эксперименте с индеанками и в эксперименте по трудовой этике, что для выделения независимой переменной должны быть созданы специальные условия. Например, если эксперимент проводится в реальной рабочей обстановке, то невозможно ограничить условия различием только по одной переменной. В некоторых экспериментах требуется большое мастерство, чтобы «очистить» независимую переменную. Например, при изучении направленного обоняния исследователь очень постарался, чтобы точно задать условия независимой переменной — разницу во времени — и ликвидировать другие переменные, т.е. щелчки реле.

Внутренняя валидность нарушается далее из-за некоторых новых типов систематического смешения. Они проистекают из того печального факта, что мы не можем делать лишь что-то одно. Во всех случаях эти типы смешения возникают оттого, что активное условие независимой переменной сопровождается активным уровнем побочной переменной. Таким образом, активный уровень независимой переменной связан с активным уровнем побочной переменной, а неактивный уровень независимой переменной связан с неактивным уровнем побочной переменной. В итоге независимая переменная смешивается с побочной переменной, и расчленить их влияние на поведение невозможно. В любом случае средством контроля такого сопутствующего смешения была схема, в которой неактивный уровень независимой переменной включал в себя активный уровень сопутствующей переменной. Это называется контрольным условием; если же используется межгрупповая схема эксперимента, то такая комбинация представлена контрольной группой. Активный уровень независимой переменной в этом случае называется экспериментальным условием, а соответствующая группа — экспериментальной группой.

Первый тип обсуждавшегося сопутствующего смешения — смешение с артефактной переменной. Он рассматривался на примерах из психофизиологии. Если животные, у которых удалена часть мозга, сравниваются с животными, не оперированными вообще, то независимая переменная (удаление или неудаление части мозга) смешивается с артефактной переменной (повреждение других тканей). Поэтому необходимо ввести в эксперимент прооперированную контрольную группу животных для сравнения с оперированной экспериментальной группой. Эта контрольная группа подвергается той же самой операции, исключая удаление исследуемой части мозга. Подобным же образом в эксперименте, в котором введение лекарства является экспериментальным условием, должно быть контрольное условие с введением плацебо.

Для иллюстрации других типов сопутствующего смешения использовался эксперимент, проверяющий гипотезу, что дети плачут из-за ухода близкого им человека (матери). К этим типам относится, во-первых, смешение с расширенной переменной, когда вообще кто-нибудь уходит. Во-вторых, смешение с вторичной переменной — ребенок находится с кем-то пли совсем один. В-третьих, смешение с другой вторичной переменной — с кем ребенок остается. Все это были иллюстрации сопутствующего смешения, называемого естественным смешением, в отличие от искусственного смешения, описанного выше. Термин «естественное» означает только, что связь уровней независимой переменной и уровней побочной переменной заложена в «природе вещей», а не вызывается исключительно действиями экспериментатора. Способ контроля естественного смешения тот же, что и в случае искусственного смешения: создание контрольного условия, которое включает в себя активный уровень сопутствующей переменной. Если нарисовать диаграмму уровней, по которым различаются условия, то можно увидеть, что контрольное условие делает возможным однолинейное сравнение только по независимой переменной.

Следующей была рассмотрена проблема операциональной валидности. Как и в случае с внешней валидностью, вопрос здесь тот же: правильный ли эксперимент проведен для проверки экспериментальной гипотезы. Переменные в экспериментах с выделением независимой переменной, как правило, выражены в довольно абстрактных понятиях; экспериментальные же ситуации — гораздо конкретнее. Поскольку в экспериментах приходится делать конкретные вещи, эксперимент полного соответствия невозможен. Можно лишь постараться, чтобы конкретные экспериментальные операции репрезентировали понятия, содержащиеся в экспериментальной гипотезе. Для иллюстрации приводилось исследование влияния социальной атмосферы на поведение людей. В отношении этого исследования рассматривался вопрос, насколько точно условия независимой переменной соответствуют общим понятиям, которые они по предположению репрезентируют. Затем был проанализирован эксперимент по научению с точки зрения репрезентативности независимой переменной.

Мы рассмотрели вопрос об испытуемых, постепенно сужая их контингент. Некоторые эксперименты касаются всех животных, так что выбор конкретного вида зависит главным образом от соображений удобства. Если испытуемыми являются лабораторные крысы, то вопрос об общности результатов становится особенно актуальным. В отдельных случаях выбирается специальный вид животных из-за их характерных особенностей. Для большого количества экспериментов реальный интерес представляет поведение людей. Использование студентов колледжа вполне допустимо, но вопрос об общности результатов необходимо проверять в контексте каждого конкретного эксперимента.

И все же необходимо проводить отбор или распределение испытуемых. Как правило, исследователь в эксперименте с выделением независимой переменной не пытается получить такую выборку испытуемых, которая представляла бы некоторую популяцию. Вместо этого он (или она) сосредоточивается на вопросах внутренней валидности и проблему обобщения результатов решает путем обследования разных групп испытуемых в отдельных экспериментах.

В межгрупповых схемах применяются две различные стратегии. Одна из них включает предварительные решения, которые обсуждались на примере экспериментов с репрезентативными выборками. Другая является стратегией распределения испытуемых по группам. Если число испытуемых в группе невелико, то по мере появления новых испытуемых они распределяются по группам в последовательности регулярного чередования. При большем числе испытуемых лучше случайная последовательность распределения, так как она устраняет возможность нежелательных систематических влияний.

Для улучшения результатов, основанных на сравнении групп, могут быть использованы особенно сходные индивиды. Для этого в сравниваемые условия могут, например, помещаться особи одного помета, а в случае с людьми — монозиготные близнецы.

В современных исследованиях схемы индивидуального эксперимента используются так же часто, как и межгрупповые. Небезынтересно отметить, что эта схема может даже вылиться в эксперимент с одним единственным испытуемым. В этом случае иногда возможен надежный контроль эффектов последовательности и временных эффектов.

Мы дали краткую характеристику направления нашего движения в предыдущих и последующих главах. Было отмечено, что мы начали с весьма конкретных исследований, позволяющих производить минимальные обобщения. Затем мы перешли к более абстрактным переменным и к более широким обобщениям. В последующих глазах будут описаны эксперименты, которые выявляют более полный, менее ограниченный набор факторов, влияющих на поведение.

ВОПРОСЫ

  1. Сравните эксперимент по спасательным работам на море из главы 3 с экспериментом по трудовой этике с точки зрения характера независимой переменной — изолированная она или составная.
  2. Сравните эксперимент на предпочтение сорта томатного сока из главы 1 с экспериментом на направленное обоняние в отношении чистоты экспериментальных условий.
  3. Что мы подразумеваем под контрольной группой в эксперименте, требующем удаления части мозга?
  4. В чем разница между процедурным смешением, которое возникает из-за того, что эксперимент не может быть идеальным, и сопутствующим смешением как результатом того, что эксперимент не может быть чистым?
  5. Приведите пример естественного сопутствующего смешения и покажите, каким образом оно может быть устранено. Составьте таблицу для пояснения ситуации.
  6. Как сформулировать гипотезу, которую можно проверить экспериментальным путем?
  7. Как используется идея эксперимента полного соответствия в экспериментах на выделение независимой переменной?
  8. Как экспериментатор решает вопрос об использовании того или иного вида животных в эксперименте?
  9. Что подразумевается под сериальными стратегиями распределения испытуемых по группам?
  10. Всегда ли эксперименты на выделение независимой переменной проводятся на репрезентативных выборках? Хорошая ли это идея?
  11. Опишите логическую последовательность предшествующих и последующих тем в данной книге.

Глава 6

Большие различия в действии разных условий независимой переменной приводят экспериментатора к выводу о подтверждении экспериментальной гипотезы. Меньшие различия интерпретируются как случайный результат. Основанием для таких различных выводов является статистическая значимость. Более конкретно это означает, что если бы в идеальном или бесконечном эксперименте различие отсутствовало, то было бы мало вероятно получить в конкретном эксперименте большое различие, не так невероятно — меньшее различие.

В научных экспериментах — в отличие от тех, где существует только два практических исхода — возможны три заключения из экспериментальных данных. В дополнение к подтверждению экспериментальной или противоположной ей гипотезы возможно заключение о не подтверждении ни одной из них. Какое именно из этих трех заключений будет сделано, зависит от статистического решения относительно нуль-гипотезы.

Если бы был проведен бесконечный эксперимент и нуль-гипотеза оказалась верной, то среднее различие между условиями было бы равно нулю. Однако в отдельных конкретных экспериментах различия могут быть как в пользу одного условия, так и в пользу другого. Если различие настолько велико, что очень редко могло бы быть получено в бесконечном эксперименте, нуль-гипотеза отвергается. Однако если вероятность появления различия, подобного полученному, достаточно высока, нуль-гипотеза не отвергается. Когда нуль-гипотеза отвергается, делается вывод о подтверждении экспериментальной гипотезы (или противоположной ей гипотезы, если различие оказалось с обратным знаком). Когда нуль-гипотеза не отвергается, ни экспериментальная, ни противоположная ей гипотезы не подтверждаются. Это последнее заключение может означать одно из двух. Если данные ненадежны, заключение будет состоять в том, что действие независимой переменной просто не удалось выявить. При надежных данных экспериментатор может быть уверен, что условия не оказывают различного действия.

Величина различия между условиями, необходимая для отвержения нуль-гипотезы, определяется двумя факторами. Первое — это надежность. Чем больше надежность, тем меньше различие, допускающее отвержение. Второй фактор — вероятность того, что экспериментатор рискнет ошибочно отвергнуть нуль-гипотезу, когда она верна. Он называется альфа-уровнем правила его решения. Ошибка, которая будет увеличиваться с возрастанием этого риска, называется ошибкой I типа. Так, риск ошибки I типа в пять раз выше при альфа-уровне 0,05 по сравнению с альфа-уровнем 0,01.

Однако при уменьшении альфа-уровня увеличивается риск противоположной ошибки. Это риск не отвергнуть нуль-гипотезу, когда верна некоторая другая гипотеза (и, конечно, нуль-гипотеза ошибочна). Это называют ошибкой II типа. Для любого конкретного набора данных эта вероятность (называемая бетой) увеличивается с уменьшением альфа-уровня. Однако, увеличивая надежность эксперимента, можно найти приемлемую величину бета даже при строгом альфа-уровне. Говорят, что статистическая проверка имеет силу в той мере, в какой низка вероятность бета и в которой может быть выявлено истинное различие.

Использование строгого альфа-уровня (например, 0,01) рекомендуется в тех случаях, когда различие между условиями должно подтвердить новую гипотезу, противоречащую общепринятому мнению. Эта строгость нужна для того, чтобы не засорять науку слишком большим числом артефактов. 5 ложных утверждений из 20 — это слишком тяжелое бремя для науки. С другой стороны, если результаты показали влияние независимой переменной, его нельзя сбрасывать со счетов только потому, что различие не достигло уровня значимости 0,01.

Назначение проверок на значимость — повышение внутренней валидности. Ведь внутренняя валидность и проверка нуль-гипотезы могут быть описаны через бесконечный эксперимент. В бесконечном эксперименте, состоящем из множества отдельных экспериментов (таких, какие проводятся реально), общее среднее различие между условиями будет равно нулю, если верна нуль-гипотеза. Однако различия, обнаруживаемые в отдельных экспериментах, не будут равны нулю, а лишь только распределятся вокруг нуля. Экспериментатор может выяснить это распределение. Он соотнесет полученное различие с его вариабельностью, но не будет делать вывода о различии только на том основании, что много отдельных экспериментов дает достаточно большое различие.

Если же верна нуль-гипотеза, экспериментатор также хотел бы обосновать и этот вывод. Но даже чтобы иметь возможность сделать вывод о правильности какой-то другой гипотезы, экспериментатор вынужден идти на некоторый риск. Экспериментатор хочет иметь заключение о верности экспериментальной гипотезы с такой степенью обоснованности, как если бы ожидаемое различие было получено в бесконечном эксперименте. Положение, которое он, в конце концов, занимает между ошибками I и II типа, отражает его оценку относительной валидности обоих типов обоснованности.

На пути к окончательным выводам остаются три трудные проблемы. Первая состоит в том, что только одного значимого различия недостаточно, если ожидается сильное влияние независимой переменной. Статистическая проверка наиболее пригодна в тех случаях, когда действие исследуемого фактора «зашумлено» другими случайными факторами. Вторая проблема заключается в том, что использование слишком большого числа испытуемых обнаруживает действие определенных дополнительных факторов. Третья проблема касается универсальности результатов. Можно ли отнести выводы ко всей соответствующей популяции, если они справедливы даже не для всех исследовавшихся испытуемых? Причем не только по причине случайных изменений. Наконец, было показано, что мы не можем принять экспериментальные выводы только на основе постоянных и достаточно сильных выявленных различий между условиями. Эксперименту будет недоставать внешней валидности, если он не будет удовлетворять хотя бы одному из целого ряда условий. Более того, он не будет обладать даже внутренней валидностью, если не организовать достаточный контроль за систематическим смешением.

ВОПРОСЫ

  1. Почему Флинер и Кернс заключили, что старшие дети больше плачут при уходе матери, чем при уходе ассистентки, а у младших детей такого различия нет?
  2. Что такое нуль-гипотеза?
  3. Почему в эксперименте Флинера и Кернса возможно третье заключение, в то время как в эксперименте Йоко по предпочтению сорта томатного сока только два?
  4. Что показывает диаграмма, иллюстрирующая: различие между средними для каждого условия, статистическое решение и заключение об экспериментальной гипотезе?
  5. Как влияет уменьшение надежности на величину различия между средними, требуемую для отвержения нуль-гипотезы?
  6. Как влияет альфа-уровень в правиле решения на величину различия между средними, требуемую для отвержения нуль-гипотезы?
  7. Соотнесите альфа-уровень с риском ошибок I и II типов.
  8. Когда особенно важно избегать ошибки I типа?
  9. Опишите три фактора, влияющие на вероятность бета. Что это означает в отношении риска ошибки II типа?
  10. При каких условиях экспериментатор может заключить, что независимая переменная не оказывает действия?
  11. Почему говорят, что разумное использование правила статистического решения способствует внутренней валидности?
  12. Может ли быть в эксперименте слишком много испытуемых?
  13. Если в эксперименте получены надежные данные и высоко значимые различия между условиями, обеспечивает ли это полностью валидность вывода?

Глава 7

Было рассмотрено три возможных двухуровневых эксперимента, которые оказались совершенно неадекватными по сравнению с аналогичным реально проведенным многоуровневым экспериментом. На этом примере были разобраны преимущества многоуровневого эксперимента.

Во-первых, он обеспечивает большую внутреннюю валидность, чем простые эксперименты, описанные в предыдущих главах. В некоторых экспериментах, где фигурируют только два уровня, независимая переменная по существу является количественной. Использование только двух уровней такой переменной может не выявить истинного отношения, которое могло бы быть найдено в идеальном количественном эксперименте, где используется неограниченное число уровней. Чем больше уровней независимой переменной мы используем, тем больше мы приближаемся к этому невозможному эксперименту и тем больше становится внутренняя валидность. Кроме того, лучше оказывается контроль за сопутствующим смешением. Если активный уровень независимой переменной сравнивается с ее нулевым (или неактивным) уровнем, это может косвенно ввести активный уровень вторичной переменной. В качестве примеров приводилось осознание действия лекарства и установление контакта с экспериментатором. В то же время ступенчатое изменение независимой переменной, приводящее к ступенчатому изменению зависимой переменной, делает маловероятным такое смешение.

Многоуровневые эксперименты превосходят более простые эксперименты и в другом отношении. В них могут проверяться гипотезы, которые ведут к более тонкому пониманию механизмов поведения. Во-первых, в сравнении с экспериментами, использующими качественные независимые переменные, здесь можно лучше выделить единичную переменную. Качественная переменная — такая, как чтение — в отличие от прослушивания — может быть только нерасчлененным комплексом факторов. Возможностей для введения количественных переменных — сколько угодно, включая шкалирование поведения.

Дальнейшие преимущества определяются возможностью проверки более тонких гипотез об отношении между независимой и зависимой переменными. Часто наиболее правильной оказывается гипотеза о максимальной (или минимальной) величине зависимой переменной при некотором промежуточном уровне независимой переменной. Она может следовать из теории двух процессов, связанных противоположным образом с уровнем независимой переменной. Например, может случиться, что негативный процесс берет верх над позитивным только на очень высоких уровнях независимой переменной. Именно так был проанализирован воображаемый многоуровневый эксперимент по трудовой этике. В качестве основных здесь были предположены «стремление к активности» и чувство «неприязни» к нажиманию на рычаг. Другим примером служила теория, согласно которой в основе поведения лежат два позитивных процесса, на которые увеличение уровня независимой переменной влияет противоположным образом. Именно так был проанализирован эксперимент по запоминанию списков студентами колледжа с варьированием интервалов между элементами запоминаемого списка и эксперимент, связывающий величину удара током с перцептивным различением у танцующих мышей. Переменные, лежащие в основе поведения в этих двух экспериментах, представляли собой различение стимулов и образование ассоциаций.

Многоуровневые независимые переменные позволяют проверять более детализованные экспериментальные гипотезы. Последние создаются на основе моделей и теорий, объясняющих, каким образом ступенчатые изменения независимой переменной приводят к изменению зависимой переменной. Так, на основе сканирующей модели мнемического поиска была выдвинута гипотеза о том, что одинаковые по абсолютной величине приросты объема запоминаемого материала будут сопровождаться примерно равными абсолютными приростами времени поиска: гипотеза «абсолютно-абсолютных» отношений. При исследовании связи между числом альтернатив и временем реакции проверялась гипотеза «относительно-абсолютного» отношения: при каждом увеличении количества альтернатив в одно и то же число раз будет наблюдаться увеличение времени реакции на одну и ту же абсолютную величину. Эта гипотеза была основана на модели наиболее эффективного способа принятия решения. На основе теоретического представления о том, как сенсорные органы превращают физическую энергию стимула в нервное возбуждение, была предсказана гипотеза «относительно-относительного» отношения между величиной поднимаемого веса и субъективным ощущением тяжести. Во всех перечисленных случаях результаты подтверждали гипотезу: при выборе на осях соответствующих шкал получалась линейная зависимость между независимой и зависимой переменной.

В многоуровневых экспериментах могут быть использованы и ранее описанные экспериментальные схемы. Для межгрупповой схемы существует практическая трудность: она состоит в необходимости привлекать слишком большое количество испытуемых. Внутрииндивидуальный контроль наиболее пригоден в случаях, когда предъявляются в случайном порядке короткие пробы на различных уровнях в большом наборе проб. Когда же каждая проба длительна, как это обычно и бывает при использовании внутрииндивидуального уравновешивания, в многоуровневом эксперименте возникает практическая трудность: необходимость затраты слишком большого времени на каждого испытуемого.

Эти практические трудности можно преодолеть путем использования кросс-индивидуального реверсивного уравнивания. Однако эта конкретная схема не обеспечивает контроль эффектов неоднородного переноса от предыдущей пробы к следующей. Такой контроль обеспечивает схема полного позиционного уравнивания, но она требует слишком большого числа различных последовательностей (и групп испытуемых), чтобы быть практически удобной. Типичным методом внутрииндивидуального уравнивания, который также контролирует неоднородный перенос, является латинский квадрат. В этой схеме каждый уровень независимой переменной появляется однажды в каждой позиции последовательности. Более тщательный контроль достигается путем использования только сбалансированных квадратов, в которых каждому уровню независимой переменной только один раз предшествует каждый из остальных уровней.

И все же ни одна схема кросс-индивидуального уравнивания не обеспечивает контроль эффектов ряда. В любой последовательности низким уровням чаще предшествуют более высокие, чем более низкие, уровни, а высоким — низкие, и это порождает угрозу асимметричного переноса. Другим описанным эффектом ряда является эффект центрации. Он возникает в связи с тем, что только уровням, близким к середине ряда, могут в равной мере предшествовать и высокие и низкие уровни. Более благоприятное положение средних уровней было показано в эксперименте с обработкой деталей.

Был рассмотрен ряд полезных советов. Так, при кросс-индивидуальной схеме вместо реверсивного уравнивания лучше использовать латинский квадрат; для того чтобы избежать влияния утомления, необходимо давать достаточный отдых между пробами; и, наконец, для контроля за эффектами ряда необходимо использовать перекрывающиеся диапазоны уровней независимой переменной.

Независимо от экспериментальной схемы при проверке точных гипотез все-таки остаются две угрозы внутренней валидности. Одна из них состоит в том, что форма кривой, полученной на группе испытуемых, может не представлять индивидуальные кривые ни одного испытуемого. В идеальном эксперименте один и тот же испытуемый должен был бы проверяться одновременно по всем уровням. Поэтому возможность неверной представленности истинного отношения в полученном отношении является источником внутренней невалидности. Особенно подвержены такой опасности межгрупповые схемы. Опасность может быть уменьшена благодаря уравниванию испытуемых и использованию однородных групп.

Другим источником неверной представленности отношения между независимой и зависимой переменными может быть искажающее действие измерительных приборов и шкал, с помощью которых измеряют зависимую и независимую переменные. С наибольшей вероятностью такое искажение возникает в двух типах измерения. Первый случай — когда необходимо усиление малых физических величин, второй — когда используется субъективное шкалирование.

В предыдущих главах в качестве угроз внутренней валидности описывались ненадежность и систематическое смешение. В этой главе была показана новая угроза — неверно установленное отношение между независимой и зависимой переменными. Оно может быть следствием использования усредненных кривых, которые не представляют индивидуальные, затем — применения слишком малого числа уровней независимой переменной, наконец, проведения неверных измерений.

ВОПРОСЫ

  1. Чем многоуровневый эксперимент отличается от экспериментов, описанных в предыдущих главах?
  2. Что означает утверждение, что многоуровневые эксперименты обеспечивают контроль для проверки экспериментальных гипотез, которые могли бы быть проверены и в двухуровневом эксперименте?
  3. Сравните с теоретической точки зрения результаты эксперимента с количественным изменением независимой переменной и эксперимента с условиями, отличающимися только качественно.
  4. Что подразумевается под экспериментальной гипотезой максимума или минимума?
  5. Почему к эксперименту Стернберга по исследованию памяти приложим термин «абсолютно-абсолютного» отношения? Что лежало в основе этой экспериментальной гипотезы?
  6. Определите различие между количественными экспериментальными гипотезами Хика (1922) о времени реакции и Харпера и Стивенса (1948) о субъективной тяжести.
  7. Каковы практические причины использования позиционного уравнивания по всем испытуемым, а не межгрупповой схемы или интраиндивидуального позиционного уравнивания?
  8. Что такое латинский квадрат?
  9. Может ли предохранить полное позиционное уравнивание от эффектов неоднородного переноса? От эффектов ряда?
  10. Какие угрозы внутренней валидности остаются при использовании любых схем проверки гипотезы точного отношения между независимой и зависимой переменными?
  11. Понятие идеального эксперимента было вновь введено в связи с угрозой внутренней валидности, отличающейся от ненадежности и систематического смешения. Как это было сделано? Как бы вы в таком случае определили внутреннюю валидность?






©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.