Лекции.Орг


Поиск:




Диагностический процесс и эмпирический цикл




Четкая модель диагностического процесса есть модель эмпирического исследования. Эмпирический цикл — хоро­шо известная схема для проведения научного исследования в науках о человеке. Этот цикл разработан Де Гроотом и стал руководством для проведения эмпирических исследо­ваний. По сути, первоначально книга планировалась как учебник по научно обоснованной диагностике. Уже в 1950 г. Де Гроот применил цикл при индивидуальном диагности­ческом обследовании. Связь между научным исследовани-


ем и диагностической деятельностью привела к улучшению профессиональной диагностической деятельности.

Эмпирический цикл считается базовой схемой для логи­чески-методологического изучения исследовательского процесса как такового, осмысления и вынесения суждений в эмпирических науках. Этот цикл содержит пять фаз:

1. Наблюдение, сбор и категоризация эмпирических фак­тов, оформление гипотезы.

2. Индукция, формулирование конкретных гипотез.

3. Дедукция, выведение конкретных следствий из гипотезы
в форме поддающихся проверке положений.

4. Проверка гипотезы на новом материале.

5. Оценка результатов проверки в свете гипотезы и теорий, которые послужили основой для формулировки гипотезы, наметки дальнейших исследований.

Этот цикл вполне соответствует подходу логического позитивизма к получению научных знаний. В психологии он имел большое влияние. В третьей главе проанализиро­ваны некоторые элементы логического позитивизма. Ак­цент делается на логическое выведение из теории проверяемых гипотез. По словам Чечмана (1973), это и есть метод исследования по Лейбницу. С течением времени про­изошло смягчение требований к дедуктивному компоненту процесса, по крайней мере фактически. Ван дер Хейден (1995) ссылается на исследование, где клинические психо­логи признали, что они, несомненно, использовали не толь­ко дедукцию при формулировкегипотезы. Многие гипотезы были переформулированы в процессе сбора данных и даже впоследствии. Однако это не разрывало связь с теорией полностью.

Кроме эмпирического цикла, во многих учебниках опи­сан диагностический цикл. Мы приводим описание Вестен-берга и Коули (1993, стр. 348): 1.Вопрос, стоящий перед диагностом. 2.Сбор относительно неструктурированной информации,

получение данных. 3.Формулировка гипотезы.

4.Структурированный (целенаправленный) сбор данных. 5.Проверка гипотез.


 




Последний этап приводит к диагнозу. Обычно здесь де­лаются некоторые разъяснения относительно отличий этого диагноза от медицинского. Медицинский диагноз направ­лен на установление заболевания, т.е. выяснение причины симптомов. У психодиагностов ударение перенесено в боль­шей степени с причины на симптоматику (Westenberg & Koele, 1993, стр. 346). Соотношение между медицинским и психологическим диагнозами уже обсуждалось нами во вто­рой главе (Kirmayer, 1994). В медицинском диагнозе пре­обладает осмысление проблемы с позиций причинного детерминизма, что позволяет решить многие проблемы. Од­нако, согласно Кирмайеру, это осмысление и анализ недо­статочны при психиатрических нарушениях, а также при некоторых других немногочисленных нарушениях.

Диагностический цикл иногда расширяют за счет вклю­чения в него этапов воздействия и оценки результатов. Итак, существует семь этапов (Kievit& Так, 1992, стр. 40— 64):

1.Сообщение о приеме, отсеивание. 2.Совместное обсуждение и получение предварительных

показателей. З.Сбор широкого круга данных и сведений о клиенте. 4.Интеграция информации.

5.Планирование получения необходимых конкретных дан­ных. 6.Воздействие. 7.Оценка результатов.

Последние два этапа больше разрабатываются авторами, которые применяют психодиагностику в сфере решения проблем, преимущественно детских. Психодиагностика имеет большее число функций. Де Брюн (1992, стр. 167) перечисляет девять типов: регистрация, проба, предсказа­ние, профилактика, распознавание, истолкование, объяс­нение, рекомендации и оценка. Обычно к функциям диагноста относят рекомендации и решение проблемы, оп­ределение на должность (работу), отбор и классификацию обследуемых лиц.

Применение эмпирического цикла в научной деятельно­сти, при диагнозе проблем клиента или в какой-либо орга­низации (учреждении), по-видимому, не вызывает


трудностей. Цель применения цикла при постановке пси­хологического диагноза — придание клинической и диаг­ностической деятельности научного характера. Как отмечалось в первой главе, между ними существуют сход­ство и различие.

7.4.2. Эмпирический и практический циклы

Ван Страйн (1983, 1986), анализируя эмпирический цикл, задался вопросом: полностью ли он подходит для решения диагностических вопросов. Философской основой эмпирического цикла является номологически-дедуктив-ный тип мышления (см. также Brandstadter, 1990, гл.1 и 8). Для практической диагностики это означало, что теорети­чески выведенные и эмпирически обоснованные законо­мерности должны применяться при анализе конкретного случая. Это один из путей понять частное на основе общего. Практик должен установить, действию каких законов соот­ветствует данная проблема. Как следствие этого, в психо­логическом образовании возобладали курсы по методологии исследования и обучение общим законам. Сту­денты сталкивались с методологией и законами, которые совсем не соответствовали их ожиданиям, поскольку пси­хология была, с их точки зрения, наукой о человеке и его проблемах, способностях и характерных особенностях. Психологическое образование и эпистемологическая осно­ва психологии были толчком, побудившим Ван Страйна заняться диагностическим (регулирующим) циклом. Этот цикл имеет иные акценты.

Первый существенный момент диагностического цикла состоит в признании того, что в совете нуждается конкрет­ный человек. Общие законы не применимы к каждому от­дельному человеку. В большинстве случаев закон устанавливается для репрезентативной группы и бесприст­растно оценивает тот или иной параметр популяции. Мно­гие индивиды не подпадают под него. Вдобавок не существует эмпирических законов для многих подгрупп. Например, нормы, позволяющие сделать прогноз по пока­зателям тестов достижений, получены на выборке, которая не включает представителей этнических меньшинств. Бо­лее того, эта группа не гомогенна. Итак, вопрос в том, применимы ли эмпирические законы. И еще: требуется, по


 




крайней мере, некоторый период стабильности, в течение которого закон не испытывает адаптационных изменений к резко меняющимся обстоятельствам. Закон может приво­дить к формированию «консервативной» политики.

Второй существенный момент диагностического цикла обусловлен тем, что конкретный специалист может столк­нуться с поведенческими феноменами, которые не подпа­дают под существующие закономерности. Но клиент ждет ответа. Поэтому специалист строит предположения на ос­нове своего опыта, здравого смысла и профессиональных знаний. Иногда специалисты сталкиваются с одними и теми же проблемами. Они обмениваются положительным опы­том и даже формулируют теоретические положения, выве­денные из собственной практики. Ван Страйн приводит многие теории обучения, разработанные для использова­ния при различных нарушениях, как пример такого рода практических теорий. Итак, диагност идет обратным пу­тем, пользуясь индуктивно полученными теориями и даже внося свою лепту в построение этих теорий. Создание тео­рии,— это, следовательно, не только гипотетико-дедук-тивная деятельность за письменным столом.

Третий существенный пункт диагностического цикла — интерес к возможным изменениям. Исследователю часто предписывается заниматься анализом, а не изменениями. Между тем необязательно быть привержен цем Маркса, что­бы признать, что диагностическая деятельность — это часть общего плана, который в конечном счете должен при­вести к изменениям. Рекомендуя активные формы помощи (вмешательство) или предлагая решение, связанное с каки­ми-либо изменениями, он входит в противоречия с норма­ми и ценностями, собственными полномочиями или нехваткой их. В эмпирическом цикле эти вопросы выведены за рамки рассмотрения.

Диагностический (практический, регулирующий) цикл похож на эмпирический, но имеет свою специфику и вклю­чает следующие этапы:

1. Проблема.

2. Диагноз..

3. План.

4. Воздействие.

5. Оценка.


Некоторые интерпретаторы рассматривают диагности­ческий цикл как альтернативный эмпирическому. По-ви­димому, первым мысль об альтернативном характере циклов высказал Ван Страйн, но в 1984 году он возражал против этого. В его планы не входило развивать альтерна­тивную методологию, он считал диагностический цикл рас­ширенным вариантом эмпирического цикла. Можно придерживаться такой интерпретации сходства циклов, но ясно, что между ними существуют и различия.

7.4.3. Эмпирический и диагностический циклы

Объединить два цикла пытается Де Брюн. Он считает эмпирический цикл основным для психодиагностики. Вдо­бавок, с его точки зрения, диагностический вопрос — это вопрос, связанный с принятием решений. Диагност имеет право выбирать, какой критерий для него оптимален. Что­бы не оказаться жертвой предубеждений, диагност может использовать модели принятия решения. Должна быть сформулирована целевая структура. Если конкретные цели не упорядочены в определенной схеме, то неясно, что сле­дует делать в тот или иной момент. Клиенту эта схема полностью не предлагается. Обычно он не логичен в изло­жении своих проблем.

Диагностическая деятельность имеет повторяющуюся, нормативную сторону, что проявляется в логических эта­пах и характере принимаемых решений. У нее имеется и эвристическая сторона, которая обнаруживается в фазе формулировки гипотезы.

Диагностический цикл включает описанные выше эта­пы, что предполагает ясную целевую структуру. Знание методологии и процедуры эмпирического цикла дают воз­можность диагносту вывести диагностическое заключение.

Знание о процедуре содержит четыре компонента:

1. Анализ жалобы в том виде, как она сформулирована клиентом.

2. Переформулирование проблемы таким образом, чтобы она поддавалась научному анализу.

3. Диагноз.

4. Показания для терапии.

Эмпирический цикл применим к каждому из четырех компонентов, но больше соответствует компоненту диагно-


 




за.Установление диагноза рассматривается как проверка объяснительных гипотез. Компонент анализа жалобы не столь легко вписывается в цикл. Этот анализ субъективен. Тем не менее такая субъективная интерпретация может быть исследована. То же самое относится к проблеме ана­лиза переформулирования жалобы. Более легкий предмет исследования — показания для терапии. Существуют кри­терии применения специфической терапии, например, воз­можности клиента и социальные обстоятельства. Итак, эмпирический цикл применительно к этим компонентам может рассматриваться как интеграция эмпирического и диагностического цикла.

7.4.4. Модель проверки гипотез /МПГ/

МПГ — последнее звено, предшествующее соединению эмпирического исследовательского цикла с диагностиче­ским процессом. Название модели подчеркивает, что она составляет специфическую часть эмпирического цикла, т.е. относится к нему как «часть к целому». МПГ относится и к проверке гипотез на одном испытуемом, и на группе. Вот последняя ее формулировка (Van Aarle, 1990a):

1. Ориентация на жалобу.

2. Идентификация проблемы.

3. Порождение взаимно независимых гипотез, дающих свое объяснение проблемы (для предотвращения преждевре­менного вывода).

4.Выбор методик и процедур сбора данных для проверки гипотез.

5.Формулирование рекомендаций, предполагающих ак­тивные формы помощи (интервенция). В рамках этой модели диагностика понимается как ана­лог процесса научного исследования. Существует нечто, что нуждается в объяснении, а объяснение должно строить­ся на основе закономерностей. Предполагается наличие предшествующего фактора и поведенческих психологиче­ских феноменов. Закон применяется, если в наличии опре­деленные предпосылки. Например, в объяснении нуждается следующий факт: Джон не обладает необходи­мыми способностями к обучению, чтобы заниматься в на­чальной школе. Существует закономерная связь между двумя, по крайней мере, вещами. Каждый ученик седьмой


ступени с коэффициентом интеллекта ниже 75 по Вексле-ровской шкале интеллекта для детей (плюс-минус одно стандартное отклонение) и со скоростью работы, которая явно ниже, чем у сверстников, не обладает способностями для успешного окончания начальной школы. В данном кон­кретном случае важны следующие обстоятельства: Джону придется остаться в классе в третий раз, его коэффициент интеллекта значительно ниже 75, и скорость его работы по сравнению с одноклассниками также ниже.

Такое объяснение вызывает вопросы. Во-первых, доста­точно ли закономерной является связь для такого вывода. Во-вторых, достаточно ли надежны и валидны методики и наблюдения, чтобы гарантировать правильное заключение. В-третьих, разумно ли формулировать вывод в виде указа­ния на детерминацию. Ясно, что закономерностям необхо­димо эмпирическое обоснование.

В общих чертах МПГ принята как модель одной из фаз диагностической деятельности и сообщения результатов. С этой точки зрения, обсуждение оценки или диагностиче­ского процесса получило дальнейшее развитие. Диагности­ческий процесс организован в соответствии с эмпирическим исследованием, что делает для него справедливыми заме­чания Ван Страйна о трудностях распространения законо­мерностей на отдельных индивидов, кроме того, диагностический процесс предполагает интервенцию.

Как кратко отмечалось в первой главе, существуют раз­личия между диагностическим и эмпирическим циклами. В эмпирическом цикле, описанном Де Гроотом, при осмысле­нии ответа на запрос он дедуктивным способом выводится из теорий и корреляций, полученных экспериментальным путем. Эта процедура не может быть перенесена на отдель­ного человека. Как, например, возможна, проверка гипоте­зы, когда коэффициент корреляции равен нулю для данной популяциии, или проверка альтернативной гипотезы, когда коэффициент корреляции отличен от нуля (см. Kirk, 1968)? Ван Страйн предлагает более широкое понимание цикла, чем Де Гроот. В социальных науках теории вообще имеют более неопределенный характер (см. MacKav, 1993; Snow, 1937).

В этом разделе речь шла об этапах диагностического процесса. В характеристиках эмпирического и диагности-


 




ческого циклов использовались описания и предваритель­ные замечания относительно диагностической деятельно­сти. Можно признать интеграцию двух циклов плодотворной для повышения качества оценивания. Но ин­теграция не устраняет различий, существующих между циклами.

7.4.5. Помощь диагносту в принятии решений

В предыдущих разделах показано, каким образом с по­мощью методологических правил можно построить диагно­стический процесс так, чтобы получить новые знания о поведенческих феноменах. Чаше всего исследователи поль­зуются эмпирическим циклом. Существуют и другие спо­собы получения прочных знаний, но они, по крайней мере в диагностике, не слишком привлекают специалистов. Столь разное отношение может объясняться тем, что диаг­ностический процесс рассматривается как разворачиваю­щаяся во времени история со специфической структурой. В данном случае внимание будет в большей степени уделено согласованности и приемлемости частей структуры и гораз­до меньше — выяснению причин проблем клиента и воз­действию со стороны диагноста.

Этот раздел рассматривает вопросы помощи диагносту в принятии решения. Она может принимать форму прохож­дения через определенные, специально организованные этапы или форму нормативных моделей процесса. Послед­ние были заимствованы из теории решений. Подобное ис­пользование оправдано, если учитывать возможность предубеждений со стороны диагноста, нерациональность диагноза и тот факт, что человеческое суждение не всегда безупречно.

Первое, что помогает диагносту,— это развертывание процесса решения в цепочку определенных этапов. Так, планирование позволяет не упустить из виду существенных элементов процесса. Вейнстейн и Файнберг (1980) на мно­гочисленных примерах показали пользу такого планирова­ния. Прийти к ясному решению можно, учитывая соответствующие компоненты:

1. Проблема должна быть ясно сформулирована. Невозмож­но сформулировать ее всю сразу. Первый этап — катего­ризация проблемы. Нет ли у ребенка дизлексии? Есть ли


конфликт между родителями и детьми? Имеются ли труд­ности в обучении?

2. Диагност определяет ход процесса. Каков порядок его действий, когда лучше начать работу? Иногда необходимо прямое воздействие, а иногда требуется время, чтобы оп­ределить, к какой категории относятся проблемы. Каждое отдельное решение является вкладом в общее дерево ре­шений и содержит оценку определенных исходов.

3. Диагност должен организовать все необходимые этапы стратегии принятия решения. На каждом этапе он опре­деляет, что делать: применять тесты или нет, собирать новые данные или нет, применять воздействие или нет, информировать кого-то или нет, помещать клиента в со­ответствующий социальный институт или нет. После пе­речисления и объяснения преимуществ, предоставляемых альтернативными действиями, можно рассчитать, какое из них в наибольшей степени обеспечивает достижение критерия. В конкретных случаях диагност может выби­рать между а/ переводом ребенка в другую школу или б/ вторым годом обучения в той же школе по специальной или обычной программе в сочетании с дополнительным обучением родителями или без него. Вопросы, на которые необходимо ответить: какая информация существенна для выработки решения, какое действие способствует по­вышению шансов в достижении критерия.

4.Диагност должен сделать выбор, прибегнуть к воздейст­вию или нет, и выбрать вид воздействия, обеспечивающий максимальный результат при минимальных затратах для него и клиента. Такая схема весьма близка к оптималь­ной. Она помогает обратить внимание на наиболее суще­ственные моменты и обдумать наиболее важные шаги. Диагносту требуется время, чтобы взвесить все за и про­тив. Было бы интересно узнать от практиков, хорошо ли действует такой вид помощи в их практической работе. Практики говорят, что МПГ (которая также предписыва­ет этапы, но не требует подсчета возможностей) — гро­моздкая система, ничего не добавляющая к тому, что они делают и без нее.

Второй формой помощи диагносту является модель по­лезности ожидаемых последствий (multiattribute utility theory) и правило Байеса. Эти модели используются в тео­рии решений. Некоторые диагносты предпочитают форму­лировать проблему как решение проблемы. С точки зрения


 




других психологов, вообще все поведение можно рассмат­ривать как совокупность решений. Эта метафора содержит в себе перспективные возможности для диагностики.

Первая модель требует сформулировать диагностиче­ский вопрос как проблему выбора между альтернативами. Модель полезности ожидаемых последствий помогает оста­новиться на одном из нескольких реальных выборов. Раз­личные выборы можно сравнить по их характерным чертам. Приведем пример использования такой модели (Vlek, 1987, стр. 74—75): у пожилой супружеской пары имеется три ва­рианта выбора: а/ остаться в своем доме;

Ь/ переселиться в квартиру, где им будет предоставлен ежедневный уход;

с/ переселиться в дом для престарелых.

Выбор определяется семью признаками (обстоятельства­ми, аспектами, чертами), степень важности которых зави­сит от специфики супружеской четы: 1/ стоимость; 2/ переезд; 3/ легкость ремонта; 4/ повседневная забота;

5/ собственные возможности в отношении транспорта; 6/ личная свобода; 7/ личный комфорт.

Супруги должны оценить в баллах (например, от 1 до 10) три возможных выбора по степени привлекательности (по­лезности). Они должны взвесить для себя важность каждого признака, сравнивая и выбирая между ними. Результаты этого «взвешивания» возможных выборов должны сумми­роваться (до 10). Три выбора оцениваются по семи призна­кам в баллах от 1 до 10. Веса умножаются на число оценок и суммируются. Выбор, получивший наибольшее число баллов, указывает на реально предпочитаемый вариант. Если же набранное количество баллов по отдельным выбо­рам мало отличается, конечно, трудности выбора остаются. Вторая модель — правило Байеса. Это правило может применяться при индивидуальном диагностическом анали­зе проблем конкретного клиента. Суть правила в том, что имеется некая априорная гипотеза, которая изменяется в


зависимости от получаемой информации. Правило облека­ется в различную форму. Вот пример простой формы:

Вероятность, что гипотеза Н (маленький Джон лжет) достоверна, как показывают данные наблюдений (запина­ется и краснеет) D = [вероятность запинок и покраснения (D) как следствия лжи (Н) + (оценка в 95%) умножается на априорную вероятность, что ребенок обманывает, оце­ненную в 3% ] = 0,95 х0,03 = 0,0285. Эта величина делится на следующее выражение: |сумма вероятностей, среди ко­торых (а) вероятность последствий из обмана в форме за­пинок и покраснения (равная 95%) умножается на вероятность лжи (равную 3%) плюс (Ь) вероятность утвер­ждения, что капризный ребенок лгун (Hi 10%), умножает­ся на вероятность, что ребенок не лгун (1,00-0,03 = 97%) ] = 0,1255.

Далее вероятность (0,95x0,03) делится на 0,1255. В ито­ге получаем результат, равный 0,227. Итак, а-приори ве­роятность встретить ребенка, который лжет, равна 0,03 и а-постериори (после получения информации о том, что он запинается и краснеет) равна 0,227. Корректировка значи­тельная (от 0,03 до 0,227), но еще не очень высокая, несмот­ря на то, что признаки имели тесную связь с ложью (95 %).

Для того чтобы применять данное правило, необходимы некоторые сведения и установленные величины. Напри­мер, допускается, что 3% детей имеют склонность лгать; что 95% из них могут быть пойманы на обмане и что о 10% несправедливо говорят, что они лгут. Правило показывает, что нечасто встречающиеся феномены при определенных условиях становятся более вероятными, но здравый смысл легко переоценивает их вероятность. Невозможно быть полностью уверенным, что ребенок лжет, если он краснеет или запинается. Правило подкрепляется эмпирическими данными, поэтому применение правила может помочь ди­агносту.

Для того, чтобы применять обе модели, необходимы эм­пирические знания о феноменах. Вдобавок надо упорядо­чить и структурировать проблему таким образом, чтобы


 




можно было применять формулы. Специалисты, критику­ющие эти модели, указывают на возможную слабость имен­но этих допущений. Эльстер (1989), например, спрашивает, всели последствия выборов реально известны, известны ли возможности каждого выбора, связаны ли воз­можности с исходами, к которым они могут привести. Не существует простого пути получения хорошей оценки фе­номенов, особенно феноменов, на которых лежит своего рода табу. И что делать, если диагност предлагает клиенту наиболее подходящее решение в этой ситуации, а клиент говорит, что такой совет сделает его очень несчастным. Диагност оказывается вестником Соломонова решения. Юмористический случай, рассказанный в новелле Кроля (1978), показывает подобную ситуацию. Этот писатель — специалист в области вычислительной техники. В одной своей книге он упоминает об игре, в которую играл во время перерыва. Он просил коллег выбрать в офисе девушку, ко­торой они хотели бы назначить свидание, а затем охарак­теризовать женщин (своих коллег) по некоторым признакам (мы не приводим их здесь). В результате раци­ональная модель полезности ожидаемых последствий сое­динила его сослуживцев не с теми, кого они выбрали раньше. С точки зрения модели, первый выбор был нераци­ональным.

Модель должна быть снабжена самыми последними зна­ниями в конкретных областях. Существует тенденция кон­струировать экспертные системы. Такая система содержит эмпирические законы и некоторые эвристические правила. Модели подпитываются количественной и качественной информацией. Модели могут дать ответ на вопрос^ напри­мер, провести его категоризацию. Экспертная система Блонка (1995) для диагностики трудностей в обучении сравнивалась с суждениями опытных клиницистов. Модель надежна в высшей степени и требует меньше времени. Ожи­далось, что за короткий период времени экспертная система будет давать консультация по многим проблемам и вопро­сам. Этого не произошло. Нелегко разработать совершен­ную экспертную систему. Вестенбсрг и Коули (1993, стр. 369) утверждают, что в психодиагностике не существует экспертных систем и что будет очень трудно их сконструи-


ровать, поскольку отсутствуют сами строгие причинно-следственные отношения.

В этом разделе показано, что диагностический процесс можно структурировать, выделив его этапы. На каждом этапе может быть получено решение, и оно может быть связано с оценкой вероятностей, при которых положение дел или будет сохраняться, или изменится. Теория решений предлагает нормативные модели, которые называют неко­торые условия, позволяющие принять лучшее решение. Применение этих моделей связано с эмпирическим под­тверждением оценок и требованием, чтобы заключитель­ная реконструкция проблемы отражала реальную проблему. Модель должна содержать существенные аспек­ты реальных проблем. Вклад различных моделей в диагно­стику изучен только частично. Существуют проблемы, чье решение с помощью этих моделей может быть значительно улучшено. Практики не часто работают с этими моделями, а единственный способ показать их возможности и ограни­чения — использовать их. Как гласит поговорка, «не по­пробуешь — не узнаешь». Использование экспертных моделей также ограничено.

7.5. Соотношение трех уровней

Четвертый компонент психодиагностики — деятель­ность, в которой встречаются «выделенные» нами уровни. Противостояние между концепциями здравого смысла и теоретическими концепциями выражается в борьбе за на­учность практической психологии. Это противостояние ча­стично охватывает противоречия между клиническим и статистическим подходами (см. гл.2). Теоретический ана­лиз предлагает модель самой науки для того, чтобы сделать диагностику научным «предприятием». Несколько психо­логов пытались интегрировать эмпирический и диагности­ческий (или регулирующий) циклы. У них имеются как сходства, так и различия.

Математический уровень психодиагностики связан с ис­пользованием описательных моделей и моделей, предписы­вающих решения. Они играют роль в структурировании диагностического решения и помогают придерживаться не­обходимых этапов. Вдобавок они помогают интегрировать


 




информацию в соответствии с правилами. Эти правила ми­нимизируют некоторые типы погрешностей. Если модели применять в реальности, их использование означает, что типы погрешностей сводятся к минимальным. Если диаг­ност не использует модель в таких обстоятельствах, он дей­ствует нерационально. С другой стороны, нелегко найти модели, которые полностью применимы. Между прочим, противоречия между уровнями концептуально-теоретиче­ским и здравого смысла, с одной стороны, и математическим уровнем, с другой, упоминались крайне редко. Теперь мы приведем некоторые дискуссионные точки зрения. Во-пер­вых, диагност был убежден, что его суждение отражает не линейную, а более сложную зависимость. Практик же ду­мал, что он использует более сложные модели, чем линей­ная. Линейные модели были способны хорошо описывать результаты экспертных оценок. Давис (1979) даже говорил о здоровой красоте «ошибочных» линейных моделей в обла­сти принятия решения. Слово «ошибочные» относится к требованиям многих клиницистов. Гольдберг (1968) спра­шивал себя, кто был наивным: диагност или модель. Дис­куссия по оформлению суждения диагноста представлялась закрытой, поскольку линейная модель описывала резуль­таты достаточно хорошо. Позже, однако, отношение к про­блеме изменилось.

Круговое вращение модели «Большой пятерки» показы­вает, что восприятие личностных прилагательных может быть искажено двумя факторами, а это означает, что смысл прилагательных искажается, смешивается. Во-вторых, эм­пирический и диагностический циклы соединены в-МПГ. Необходимо, однако, видеть определенные различия между эмпирическим и регулирующим циклами. Не совсем ясно, нацелены ли они в точности на одно и то же в познании поведенческих феноменов. В-третьих, нормативные моде­ли помогают организовать процесс выведения диагноза как процесс решения. Это переструктурирование должно отра­жать, по крайней мере, некоторые центральные элементы реальных проблем. Применение модели требует эмпириче­ских знаний для того, чтобы получить достаточно точную оценку поведенческих феноменов. Этих знаний постоянно не хватает. Если элементы выделены и измерена их валид-ность, их следует объединить. Модели минимизируют по-


грешности. Они выполняют то, что от них ждут. При их применении погрешность сводится к минимуму. Обычно люди не приспосабливают свои действия к этим моделям. Это говорит о том, что они действуют нерационально. При­веденный аргумент критиковала, например, Ван Дам.

В противопоставлении трех уровней навязчиво встает интригующий вопрос: почему люди ведут себя иррацио­нально, не желая подчиняться правилам модели полезности возможных последствий и правилу Байеса? Или рациональ­ные действия (если говорить применительно к этим моде­лям) в конечном счете не адаптивны? Или в них нет необходимости? Или такие действия превышают человече­ские возможности по переработке информации? Или, при­нимая решение, его «автор» легко удовлетворяется результатом? Почему мы не желаем воспользоваться тем, что помогает нам действовать рационально? Симон (цит. по Kleinmuntz, 1990) полагает, что люди отбирают информа­цию в зависимости от того, устраивает ли она их, а не в соответствии с оптимумом, подсказываемым моделью.

В предписывающих моделях можно сомневаться и в том случае, если рассматривать их с других позиций. Почему люди должны быть рациональны (в том смысле, который заложен в таких моделях)? Почему люди должны создавать предписывающие модели, требованиям которых они никог­да не отвечают? Иногда такие модели напоминают идеоло­гические и религиозные системы, включающие в себя разного рода предписания, которым люди никогда не сле­дуют. «Кто без греха?»— риторический вопрос, полностью приложимый и к модели. Однако это не мешает постоянно фиксировать любые отклонения. Психологи вынесли воп­росы двух последних параграфов за скобки. Это справедли­во, потому что профессионалам непозволительно предписывать мышлению людей единую модель.

Этот раздел показывает непрекращающееся противосто­яние трех уровней. И оно плодотворно, т.к. обогащает ана­лиз диагностического процесса. Расхождение между тремя уровнями проявляется и в диагностическом процессе.


 



.



ТРИНАДЦАТЬ ИТОГОВЫХ ТЕЗИСОВ

1. Изучение диагностического процесса включает также и диагностику самого диагноста: это исследование его чело­веческих особенностей.

2. «Модель линзы» Брунсвика достаточно хорошо пред­сказывает результаты диагностической деятельности. Хоф-фман, который изучал этот процесс, не претендует на то, чтобы «посмотреть», что делается в голове диагноста.

3. Процессы «житейской диагностики» не поддаются рас­шифровке с помощью «прямого» анализа. Возможно, более успешным путем было бы сравнение непрофессионального диагностирования с нормативными моделями и подсчет ошибок и расхождений.

4. Как уже отмечалось, диагност убежден, что он орга­низует информацию не только линейно, но и конфигура-тивно. Исследования не располагают эмпирическим подкреплением этого утверждения. Определенный ответ пока не дан.

5. Профессиональных диагностов часто сравнивают с не­профессионалами. Легко предположить, что и те и другие — жертвы предубеждений, вызванных ограниченностью человеческих возможностей в переработке информации (Hogarth, 1987) и слабостью интуитивных способностей к статистическому анализу (Nissbett & Ross, 1980).

6. На исследования, выявившие предубеждения диагно­ста, наука отреагировала следующим образом: тренингами для диагностов, уменьшающими вероятность предвзятых, необъективных суждений; защитой достоинств диагноста и опровержением претензий к моделям; методологическими рекомендациями по применению эмпирического цикла, ди­агностического цикла и помощью в принятии решений.

7. Между эмпирическим и диагностическим циклами су­ществуют как черты сходства, так и различия. Имеются попытки интегрировать эти два цикла, поскольку их разли­чия невелики.

 

8. Де Брюн предлагает интегрировать эмпирический цикл, диагностический цикл и модели принятия решений.

9. Использование нормативной модели принятия реше­ний оправдывается указанием на предубеждения диагноста


и существенные недочеты в категоризации и интеграции диагностических данных.

10. Такая форма как дерево решений помогает структу­рировать диагностический процесс в целом и выбор каждого решения в отдельности. Этот способ предполагает теорети­ческое и эмпирическое знание проблемы, которая изобра­жается в виде дерева решений.

11. В психодиагностике существует лишь несколько экс­пертных систем. Проектировать такие системы сложно. Это требует знаний, оформленных в стабильные эмпирические законы.

12. Нормативная модель принятия решений минимизи­рует погрешности в соответствии с каким-либо правилом, например, методом наименьших квадратов в линейной ре­грессии. Если люди отклоняются от таких правил, они дей­ствуют не лучшим образом, т.е. нерационально. Модели не описывают и не объясняют порядок действий диагноста и не претендуют на это.

13. Необходимость принятия решений делает профессию психодиагноста тяжелой и жесткой.



Глава 8

Качество психодиагностики и использование тестов: оценка, критика и альтернативы

При определении качества диагностики следует учиты­вать выделяемые нами три ее уровня и четыре компонента. Качество зависит, помимо других причин, от соответствия требованиям этих компонентов и от попыток организовать три уровня, вопреки их фактической «нестыковке». Итак, существует необходимость в обсуждении качества теории тестов (классической и современной), теории различий между индивидами с точки зрения их предельных возмож­ностей и типичного уровня функционирования, теории сре-довых условий и теории развития, в обсуждении адекватности методик и процедур, особенно тестов, и, на­конец, адекватности диагностического процесса. Другими словами, анализ качества требует обсуждения существен­ной части как содержания, так и методов психодиагности­ки. Это, конечно, большая задача, но в известной степени ее невозможно избежать, поскольку согласно нашему опре­делению психодиагностика не имеет собственного матери­ала и собственного, только ей «принадлежащего», объекта и должна, таким образом, заимствовать их у психологии и, в частности, у ее методов. До сих пор качество психодиаг­ностики определяется главным образом на основе одного ее компонента, наиболее очевидного и конкретного,— тестов и опросников. Жаль,что сейчас отсутствует интерес к каче­ству других компонентов.

В ряде стран тесты документально оформляются и оце­ниваются. Например, в США «Ежегодник измерения умст­венных способностей» Буроса дает информацию обо всех опубликованных тестах и опросниках, для которых разра­ботан метод получения объективных показателей. С их по­мощью оцениваются межиндивидуальные различия, и уже имеются исследования их надежности и валидности.

Сколько существуют тесты и опросники, столько их и критикуют. Первая линия критики, не сходящая с повестки дня, связана с вопросом о том, отражают ли в достаточной


мере тесты, задания и задачи психологические процессы. Тесты часто конструировались в ответ на практические за­просы общества или некоторых влиятельных общественных институтов. Практические средства диагностики служили вполне определенной цели — достичь значимой предсказа­тельной валидности, но они не предлагали никакого суще­ственного продвижения в понимании психологических процессов. Конструктная валидность намечала новые пер­спективы, но терстоуновская разработка простой структу­ры не была удовлетворительной. Поиски привели к подходу, изучающему процессы переработки информации (см. гл.4). Второе, за что критикуют существующие мето­дики, связано с использованием тестов. Часто тесты исполь-зуются для принятия решений, имеющих для людей огромное значение. Объективны ли, справедливы ли такие решения в отношении любого человека и любой группы? Особое внимание вызывает в этом отношении тестирование групп меньшинств.

8.1. Качество компонентов психодиагностики

Центральное место при обсуждении качества психодиаг­ностики занимает первый компонент. Тесты и опросники являются конкретными продуктами диагностики. Разрабо­тана система для оценки тестов и опросников, затрагиваю­щая и два других компонента. Во-первых, особое значение придается надежности и валидности. Это относится в боль­шинстве случаев к классической концепции надежности и дихотомии прогностической и конструктной валидно­сти.Обычно эти вопросы обсуждаются как относящиеся к надежности. Современная теория тестов пока играет скром­ную роль. В последнем по времени издании «Стандартов» психологических тестов (1987) современная теория тестов едва ли играет хоть какую-либо роль. Можно ожидать, од­нако, что новые «Стандарты» будут включать требования, исходящие из современной теории тестов. В голландской версии «Стандартов» (1989) современная теория тестов рас­сматривается как набор моделей измерения, описывающих ответы на задания.

Теория преимущественно занимается той частью, кото­рая связана с конструктной валидностью и анализирует


 




внутреннюю структуру теста.Предполагается,что внутрен­няя структура отражает исследуемое (латентное) одномер­ное свойство.Неверно думать, что это чисто технический вопрос. Известный психометрист Лорд (1980,стр.20) писал: «Представляется достоверным,что такие тесты, как тесты на словарный запас, понимание прочитанного, арифмети­ческие операции, словесные аналогии, числовые ряды, и различные типы пространственных тестов в большей или меньшей степени близки к одномерным».Однако совсем не­трудно понять, что решение задачи требует не одной, а нескольких способностей.Мы можем легко представить се­бе тесты, которые не одномерны.Тесты достижений в химии предполагают частичную натренированность в математи­ке, а частично требуют знания нематематических фактов. Последнее замечание,возможно, соответствует действи­тельности. Бсжар (1983, стр.18), исследователь в области педагогики, доказывает, что одномерность нехарактерна для заданий или тестов,но при определенных условиях она может быть присуща ответам в заданиях. Возьмем следую­щий пример: допустим, что имеется одномерный тест на произнесение слов по буквам. Этот тест проведен в группе детей, страдающих дизлексией, и здесь он проявил себя не как одномерный. В данном случае многомерный характер теста может объясняться особым типом обучения, которое получают дети с дизлексией (Bejar, 1983). Итак, вопрос об одномерности — это вопрос эмпирический. Помимо знания внутренней структуры тестовых заданий необходимы зна­ния о взаимосвязи тестов друг с другом. Статья Кэмпбелла и Фиске (1959) повлияла на введение конвергентной и ди-скриминативной валидности.Вдобавок не надо забывать о прагматическом источнике тестов: тест должен прогнози­ровать значимый критерий (прогностическая валидность). Классическая и современная теории тестов дают воз­можность конструирования тестов и исследования надеж­ности и валидности, которые не используются во всей полноте в практическом тестировании и в диагностике.Но­вые так же, как и старые модели не исключают возможности неправильного понимания. Что делать, если модель пред­полагает одномерность ответов, а тест в какой-либо группе (как в вышеприведенном примере у детей с дизлексией)


дает не одномерные результаты, расходясь с исходной вер­сией? Можно ли тогда делать заключение о том, что тест не имеет конструктной валидности?

Во-вторых, при обсуждении тестов и опросников прини­мают в расчет теоретические источники конструкта, осо­бенности его использования, описание, категоризацию, прогностические возможности. Теоретические источники в большинстве случаев сводятся к психометрическим теори­ям о межиндивидуальных различиях в случае предельно возможного, а также типичного функционирования. Тео­рии, описывающие различия средовых условий, и теории развития едва ли играют существенную роль. Вопрос о ка­честве диагностического процесса прямо не рассматривает­ся, т.е. в оценке теста вопросы относительно качества процесса диагностики не учитываются. Однако из седьмой главы ясно, что процесс считается отвечающим научным требованиям, если он строится в соответствии с правилами проверки гипотезы.

В данном разделе показано, что качество диагностики должно соответствовать характеристикам описанных в этой книге компонентов и уровней, фактически до сих подчер­кивается только роль тестов. Разработана определенная си­стема оценки. Система основана главным образом на правилах классической теории тестов. Современная теория тестов играет весьма скромную роль в измерении макси­мальных возможностей индивида или типичного уровня функционирования. Исключение составляют тесты школь­ных достижений, по крайней мере, в Нидерландах.

8.2. Система оценки качества тестов и опросников

Тесты и опросники должны удовлетворять определен­ным требованиям. В пятидесятые годы была опубликована первая книга Американской психологической ассоциации, содержавшая Стандарты для тестирования в образовании и психологии (1954). В 1950 Гулликсен опубликовал книгу по теории тестов. В результате переработки классической теории тестов он сформулировал повышенные требования к «хорошим» тестовым методам. Последняя ревизия «Стан-


 




дартов» была осуществлена в 1985 г. Стандарты значитель­но пополнили перечень критериев для оценки тестов, прак­тики тестирования и эффективности применения. Ожидалось, что в ревизии 1985 г. будет присутствовать со­временная теория тестов. Но этого не произошло. В числе критиков (Hambleton,1986) оказались удивленные психо-метристы: новые «Стандарты» были только что подготовле­ны, и можно было ожидать,что в этой ревизии будут представлены ориентиры, задаваемые современной тео­рией тестов.

«Стандарты» в ревизии 1985 г. содержали классические разделы надежности, измерения погрешностей (в классиче­ской теоретической ориентации), нормы, шкалы и требова­ния к руководству по проведению тестов. Обновление по отношению к предшествующему опыту выразилось в диф­ференциации части «Стандартов» для различных практи­ческих сфер деятельности. Профессиональные сферы деятельности оказались настолько отличными друг от дру­га, что стало правомерным введение разных «Стандартов». Возможно также, что руководили этим разделением сами представители профессиональных сфер. «Стандарты» с не­большими различиями были приведены для клинической, педагогической психологии и психологии управления.

«Стандарты» 1974 г. использовались в Нидерландах для разработки системы оценки тестов и опросников. Эти стан­дарты были переведены на язык характеристик теста, на­личие или отсутствие которых можно было оценивать. Имелось пять категорий, каждая из которых включала оп­ределенный круг вопросов. Качество ответа на каждый воп­рос могло быть хорошим, удовлетворительным и неудовлетворительным. Анализ системы по категориям по­зволил каждую из них квалифицировать как хорошую, удовлетворительную и неудовлетворительную. Вот эти ка­тегории:

1. Цели конструирования теста.Данная категория охваты­вает вопросы, связанные с применением теста, теорети­ческими источниками конструкта и релевантностью со­держания теста. Эта категория должна включать положение об основном предназначении теста.


2. Структура теста, качество его материалов и руководства.
Данная категория связана с системой подсчета, эффек­
тивностью теста и его материалов (брошюра к тесту, клю­
чи, время тестирования), со стандартизацией, четкостью
инструкции и интерпретацией результатов.

3. Нормы. Эта категория связана с качеством норм. Пред­
ставительны ли нормы для данной популяции? Нормы,
полученные на представительных выборках, используют­
ся для интерпретации показателей. В классическом вари­
анте тестов репрезентативность норм опирается на до­
вольно широкие, общие группы. Новые «Стандарты»
(1985) более прагматичны и рекомендуют получение
норм для специфических групп.

4. Надежность. Эта категория требует наличия результатов исследования с помощью параллельных тестов (Гуллик-сеновское определение надежности), внутренней согласо­ванности, тест-ретестовой надежности, сравнения экс­пертных оценок. Подчеркивается чувствительность коэффициентов к разнообразию выборок.

5. Валидность. Эта категория ориентирована на корреляции показателей теста и конструктную валидность. В отноше­нии последней допускается, что конструкт является эле­ментом номологической сетки, так что его внешняя и внутренняя структура эксплицируемы и, следовательно, поддаются эмпирической проверке.

Как отмечалось выше, каждая категория включает опреде­ленный набор вопросов, в соответствии с которыми систе­ма квалифицирует эту категорию как «хорошую, удов­летворительную и неудовлетворительную». Систему оценки можно продемонстрировать лишь на примере ис­пользования ее в конкретном тесте. Результаты исследо­вания теста должны быть доступными.

В следующем разделе в качестве примера использования такой системы приводится разработка новой голландской версии WISC-R (Векслеровской шкалы интеллекта для детей).

8.2.1. Оценка качества WISC-R Ниже приводится оценка WISC-R по пяти приведенным выше категориям. Этот тест используется часто. В 1981 г.в Нидерландах группа голландских и фламандских психоло­гов приступила к новой адаптации теста. Руководство к


 



I ] Я. тер Лаак



нему было опубликовано в 1986/1991 гг. Оценка тестов обсуждается в голландском руководстве — «Документация по тестам и исследованиям тестов» (Evers, Van Vliet-Mulder, Ter Laak, 1992). Адаптация WISC-R обеспокоила практических психологов отчасти более высокими норма­ми. Новые показатели привели к распределению детей по школам разного уровня сложности обучения.

Оценки, приведенные ниже, согласуются с оценками «Документации» (1992). Результаты одинаковые. С по­мощью приводимых н иже примеров нам хотелось бы про­демонстрировать применение системы и высказать некоторые предложения по ее использованию.

Категория 1: теоретическая основа векслеровской шка­лы интеллекта для детей. Авторы руководства опирались на публикации Векслера, представляя теоретическое обосно­вание теста. И тест, и его направленность настолько хорошо известны, что нет необходимости описывать ни цели его использования, ни историю создания. Вдобавок тест разра­батывался для удовлетворения практической потребности в простом тесте, пригодном для широкого применения. Од­нако в 1955 г. Векслер высказал некоторые дополнительные соображения относительно применения теста.

Согласно его наблюдениям интеллект обнаруживает се­бя в нескольких различных формах поведения. В достиже-ниях по тестам интеллекта играют роль как интеллектуальные, так и неинтеллектуальные факторы (например, произвольный контроль и эмоциональная урав­новешенность). Векслер работал клиническим психологом в большом госпитале Белльвью в Нью-Йорке и был убеж­ден, что личностные характеристики (мотивация, эмоцио­нальность, любознательность, депрессивность и т.д.) влияют на показатель IQ.

Он предпочел не ограничивать измерение интеллекта одним его важным аспектом, например, абстрактным мыш­лением. По мнению Векслера, интеллект предполагает на­личие нескольких различных факторов, находящихся в иерархических отношениях. Интеллект рассматривается как способность наиболее высокого порядка. Интеллект проявляется в целенаправленном действии. По словам Век­слера, в операциональном плане интеллект определяется


как совокупная или глобальная способность индивида це­ленаправленно действовать, мыслить рационально и справ­ляться с проблемами в собственном окружении. Исходя из этого, Векслер отбирал задачи, которые коррелируют с про­явлениями интеллекта, например, со школьными достиже­ниями и профессиональным образованием.Он задался вопросом, какие интеллектуальные и неинтеллектуальные виды способностей приводят к этим достижениям. Задачи должны быть разными, привлекать легкостью подсчета от­ветов и надежностью оценки. Были добавлены «хорошие» (правильные) ответы, и полученные показатели позволили создать картину сильных и слабых сторон личности. Самое первое (по времени возникновения) разделение общего по­казателя IQ касалось показателя вербального интеллекта и показателя «интеллекта действия» (невербального интел­лекта). Их корреляция составляла около 0,70. Конечно, независимых ортогональных факторов не существует и их невозможно интерпретировать как таковые. Второй часто используемой классификацией являются факторы, предло­женные Кауфманом: вербальные способности, перцептив­ная организация, сосредоточенность и общий интеллект (см. Kaufman, 1976). В пятой главе мы останавливались на недостатках интерпретации профилей. В данной голланд­ской версии WISC—R на первой странице нет результатов субтестов, на основе которых строится графический проф­иль. Это сделано для предотвращения интерпретации силь­ных и слабых сторон интеллекта. Субтесты не обладают факторной валидностью /см.гл.5/.

У Векслера интеллект толкуется как глобальная способ­ность.Общий показатель признается хорошим индикато­ром интеллекта. По этому показателю можно предсказать адаптацию в ограниченном, но важном круге ситуаций — школьном и профессиональном образовании, на работе. Со­ставление профиля не поощряется, но и не возбраняется.

Разработка теоретической основы теста включает три вопроса. Четко определен вопрос о назначении теста. Тест используется для прогноза, и конструкт его более или менее разработан. Однако он включен в номологическую сеть не настолько четко, чтобы можно было эту сеть валидизиро-ватъ. Подтверждена релевантность содержания теста. По-


 



и*



ражает, что многие задания заимствованы из шкалы Бине-Симона. Голландская и фламандская редакции особое зна­чение придают конструктной валидности. Однако тест будет неизбежно использоваться и для прогноза. В целом тест можно оценить на «хорошо».

Категория 2: качество материалов и руководства. В упо­мянутых ревизиях тестов были тщательно проверены все задания. Система подсчета отличается достаточной ясно­стью. Стимульные материалы хорошие.Таблицы норм для голландской и фламандской выборок являются общими. Проведение теста занимает значительное время.Несмотря на справедливость некоторой критики, категория должна быть квалифицирована как соответствующая оценке хоро­шо.

Категория 3: нормы. Нормы получены на выборке от 6 до 16 лет с возрастным интервалом в один год.Выборка репре­зентативна.В каждую возрастную группу входит около ста семидесяти мальчиков и девочек.Имеются нормы для обще­го показателя IQ и отдельно для показателей вербального интеллекта и невербального интеллекта. Данные собраны в 1981 г. Ответы по девяти вопросам этой категории приво­дят в результате к оценке теста хорошо.

Категория 4: надежность. Внутренняя согласованность определялась с помощью различных методов. В большинст­ве случаев использовался коэффициент альфа Кронбаха. Вдобавок использовалась (2 (лямбда). Все коэффициенты высокие. Один субтест является тестом на скорость, для него вычислен коэффициент ретестовой надежности. Ни одно из значений не опускается ниже 0,85. Результаты оценки внутренней согласованности хорошие.Поражает, что почти ни одно руководство к тесту не дает необходимых показателей. Наннелли и Бернштейн (1994, стр. 264—265) являются исключением, и они сформулировали следующее эмпирическое правило. При коэффициенте 0,70 надеж­ность признается умеренной, для исследований требуется коэффициент надежности 0,80, а для целей отбора едва достаточным минимумом надежности считается 0,90. По­разительно, что в характеристиках теста отсутствуют ко­эффициенты стабильности. Хотя можно понять, что повторный сбор данных — большая работа, необходимо


иметь соответствующие коэффициенты ретестовой надеж­ности. Выводы здесь опираются на семь вопросов, и суще­ствует компромисс между хорошей внутренней согласованностью и недостаточной стабильностью, поэто­му оценку теста по этой категории можно определить как «удовлетворительную».

Категория 5: валидность. Названные ревизии теста сде­лали упор на конструктной валидности. Векслер не разра­ботал номологическую сеть полностью, но с течением времени при анализе заданий интеллектуальных тестов на­капливался соответствующий опыт. В редакциях теста ис­пользовались разные факторно-аналитические модели. Результаты анализа немного отличались, и авторы реко­мендовали факторы Кауфмана. Это представляется разум­ным, потому что многие практики используют эти факторы.

Конструктная валидность проанализирована в соответ­ствии с принятыми правилами. Отсутствуют коэффициен­ты прогностической валидности. Имеются корреляции с другими интеллектуальными тестами. Эти коэффициенты приведены в новом разделе по валидности, но могут рас­сматриваться как данные по конструктной валидности. Как незначимые приводятся корреляции теста с чтением и арифметикой на первой и второй ступенях обучения. Ква­лификация теста по сумме тринадцати вопросов может быть только неудовлетворительной, поскольку первоначально тест использовался как прогностический. Требуется немно­го времени, чтобы получить соответствующие коэффици­енты прогностической валидности. Тогда может быть дана другая квалификация.

Как упоминалось выше относительно коэффициентов надежности, в нескольких (немногочисленных) руководст­вах используются эмпирические правила ранжирования коэффициента прогностической корреляции. Можно было бы остановиться на том, что целью является достижение значимых корреляций. Однако у исследователя обычно бо­лее высокие запросы. Он стремится объяснить большую часть дисперсии. Что это такое — «большая» часть? На­ннелли и Бернштейн (1994, стр. 99—100) замечают, что эмпирически найденные корреляции редко бывают выше, чем 0,30—0,40. В какой-то степени это разочаровывает, но


 




авторы находят некоторое утешение в сравнении с дости­жениями других наук: Например, тест способности к школьному обучению не менее прогностичен для ступеней колледжа, чем метеорологический прогноз погоды на бли­жайшие десять дней (стр. 100).

Этот раздел посвящен системе оценки тестов. Категории и пункты такой оценки соответствуют «Стандартам» 1974 г. Данная система привлекалась для работы с голландским вариантом WISC-R. Результаты применения этой системы согласуются с оценкой теста по голландской системе «До­кументации тестов и исследований тестов» (Evers, et al.1992, 539—562).

8.3. Качество диагностики: совершенствование «Стандартов»

Не существует окончательного заключения о качестве психодиагностических средств. За последней по времени редакцией «Стандартов» (1985) вскоре последует шестая редакция. Чтобы дать представление о «Стандартах», ниже приводятся некоторые примеры, заимствованные из гол­ландской редакции американской версии (1985).

Для раздела «Валидность» существует 26 стандартов. Например, правило 1.12: Все критерии измерения и осно­вания выбора этих критериев должны быть описаны деталь­но, тщательно. Надежность и погрешности измерения содержат двенадцать стандартов. Например, правило 2.10: Коэффициенты надежности могут быть различными для разных популяций. Тест должен иметь коэффициенты на­дежности применительно к каждой популяции, для которой он рекомендован.

В разделе «Усовершенствование теста» приводятся 23 стандарта. Например /3.23/: Когда при подсчете результа­тов по тесту играют роль субъективные оценки диагноста, должна быть полностью описана основа системы оценива­ния, а также тренировка, которая необходима для достиже­ния достаточной степени согласованности разных мнений.

«Шкалирование, нормы, и сравнение тестовых показате­лей» включает семь стандартов. Например/4.5/: Если мож­но ожидать,что тест будет использоваться для интерпретации результатов групп, а не отдельных лиц, то


и нормы должны быть соответствующими, основанными на групповых данных.

Категория «Руководство» содержит одиннадцать стан­дартов^ 5.7 заключается в следующем: «Рекламный мате­риал для теста должен содержать правдивую и валидную информацию. Издателям тестов следует избегать преуве­личения возможностей теста.» За «Стандартами» 1985 г. скоро последуют новые, в которых, возможно, найдут свое место открытия и достижения современной теории тестов. Хамблтон (редактор обзорных комментариев издания 1985 г.) — сделал несколько критических замечаний, например, о количестве правил и уместности некоторых стандартов, отсутствии стандартов,соответствующих современной тео­рии тестов, о разделении стандартов на уровни (существен­ный, первоначальный, высоко желательный, отвечающий стандарту, второстепенный) и много других, указывающих на невалидность шкалы суждений, несколько замечаний по тестам достижений, высказал предостережение против не­брежного применения «Стандартов», а также невозможно­сти удовлетворить все требования категорий надежности и валидности, упомянул об избытке профессиональной лек­сики. Эти комментарии могут помочь создателям шестой редакции «Стандартов».

В этом разделе показано совершенствование «Стандар­тов» для тестов. Это логическое следствие разработки ком­понентов и уровней диагностики. Критика последней (1985) редакции «Стандартов для психологических и обра­зовательных тестов» вскоре будет учтена новым, шестым, изданием «Стандартов».

8.4. Критика: сопоставление тестов

с содержанием психических процессов

в реальном контексте

Тесты и опросники направлены на измерение «продук­тов», а не процессов. Это мнение о тестах интеллекта по­служило Пиаже поводом для отказа от предложения адаптировать шкалу Бине-Симона для Швейцарии. С того времени это критическое замечание повторяется в той или иной форме. Сегодня можно видеть два варианта этой ли­нии критики и два типа ответов на нее.


 




1. В ответ на упрек в пренебрежении процессами их пыта­ются исследовать в рамках эмпирически-аналитической методологии. Примером может служить исследование ин­формационных процессов. Некоторые их примеры приво­дились в четвертой главе.

2. Другая критическая точка зрения отвергает эмпириче­ски-аналитический подход, считая его невалидным для получения информации о реальных процессах. С таких позиций высказывает критику Инглби (1994). Он отвер­гает претензии на объективность информации о человеке, если она получена с помощью тестовых показателей. Че­ловек рассматривается как существо, неразрывно связан­ное с окружающей средой. Инглби называет тестовые по­казатели «обманчивыми и ограниченными, поскольку не существует объективного или независящего от от теоре­тических положений наблюдения и каждый индивид "впаян" в социальный контекст» (стр. 117). Психология тестов основывается на «вере» и существует как «наука» в силу того, что «имеет общественный статус и власть». Эти замечания носят преувеличенный характер и рас­сматривают работу диагноста как бессодержательную. Положение сводится к тому (на языке теории тестов," не приемлемой для Инглби), что существует столько досто­верных показателей индивида, сколько существует кон­текстов, в которых ему случается проявлять себя" Непра­вильно искать у индивида один истинный показатель, который может быть оценен количественно.

Диагност не согласится с такой точкой зрения. В дости­жениях и характеристиках индивида существует некоторая стабильность, а назначение применения тестов — не в пол­учении власти. Назначение теста — в сборе информации, которая может помочь в принятии решения. Индивид не рассматривается как некая монолитная констелляция. Он также не рассматривается обособленно от ситуации и кон­текста, но вместе с тем не следует думать, что индивид целиком и полностью зависит от контекста. Исследование должно обретать удвоенную силу благодаря знаниям инди­видуальных характеристик в зависимости от контекста и вне его.

Инглби высказал три фундаментальных положения, за­ставляющих сомневаться в результатах теста. Во-первых, результаты отражают субъективное мнение испытуемого о


ситуации тестирования. Если представление испытуемого отличается от замысла тестирующего, результат может быть невалидным. В таком случае тестирующий будет ста­раться прояснить испытуемому цель тестирования. Вдоба­вок, если это случается с тестом или батареей тестов регулярно, данная процедура будет приводить к невалид­ным результатам, в том числе отсутствию прогностической и конструктной валидности. Психолог, занимающийся те­стами, признает, что число как продукт теста является ре­зультатом многих процессов, некоторые из которых ему известны, а многие нет. Более того, он умышленно заклю­чает некоторые факторы в скобки. Избежать этой процеду­ры ученый, ограниченный рамками существования «здесь» и «теперь» (кантовские синтетические априорные сужде­ния), не может. Вопрос в том, как далеко заходит это огра­ничение, насколько значима такая редукция, поскольку важно не потерять целое. В-третьих, поведение — это те или иные проявления индивида в естественной ситуации. Число баллов не может служить показателем «внутренней» способности индивида, что не будет отрицать ни один диаг­ност.

Приведенные выше аргументы подчеркивают чувстви­тельность показателей теста к влиянию различных факто­ров. Стандартизация теста означает, что среда берется как более или менее одинаковая для всех индивидов. Различия, выявленные в условиях стандартизации, рассматривались как выражение реальных индивидуальных различий. Итак, влияние условий не отрицается, но оно вынесено за скобки. Можно, конечно, попытаться сделать темой эмпирического изучения контекст и его различия. Но и при таком типе изучения тесты необходимы для демонстрации влияния контекста.

Если есть заинтересованность в изучении воздействия контекста на поведение, следует разрабатывать процедуры, которые расширяют возможности выявления влияний кон­текста. Ингбли утверждает, что эти процедуры в то же время более адекватно покажут психологические процессы. Процедуры характеризуются изучением с помощью наблю­дения экологической ниши индивида — плотным наблюде­нием и отсутствием спешки в теоретическом обосновании.


 




Это напоминает старое изречение представителей феноме­нологии: «То, что являет себя так, как оно являет, само позволяет себя являть». Качественный подход должен быть разработан для некоторых вопросов и проблем точно так же, как совершенствовались тесты. Какова структура процеду­ры, как должны быть описаны результаты?





Поделиться с друзьями:


Дата добавления: 2016-10-30; Мы поможем в написании ваших работ!; просмотров: 665 | Нарушение авторских прав


Поиск на сайте:

Лучшие изречения:

Начинать всегда стоит с того, что сеет сомнения. © Борис Стругацкий
==> читать все изречения...

1328 - | 1145 -


© 2015-2024 lektsii.org - Контакты - Последнее добавление

Ген: 0.011 с.