В практике профессионального психологического отбора кадров используется большое количество разнообразных методик, способов и приемов, позволяющих оценить уровень развития тех или иных психологических и психофизиологических свойств у испытуемых. Общепринятой классификации этих методов не существует.
Различными авторами многократно предпринимались попытки систематизации наиболее общих сведений о направленности, надежности, валидности, форме и условиях проведения тестов. Однако особого успеха эти попытки не имели. По форме и условиям проведения различают: экспериментальные и неэкспериментальные, лабораторные и клинические, исследовательские и диагностические методы. Выделяют 3 большие группы методов:
Регистрация реального поведения человека в повседневной жизни, так называемые 1,-данные (Life record data). К числу методик, входящих в этот метод (по сути метод наблюдения), можно отнести: наблюдение и телерегистрацию двигательных, речевых, эмоциональных и других реакций в реальных ситуациях жизнедеятельности с последующей экспертной оценкой поведенческих проявлений психологических и психофизиологических свойств испытуемого.
Изучение психологических и психофизиологических свойств с помощью опросников и других методов самооценки — Q-данные (Questionnaire data). По сути, это регистрация в экспериментальных условиях результатов наблюдения испытуемого за самим собой. К числу методик самооценки относятся: методика многостороннего исследования личности (русифицированная адаптированная версия известного теста MMPI), опросник 16-ФЛО, опросники Айзенка, шкалы ситуационной и личностной тревожности и многие-многие другие.
Объективные измерения психологических и психофизиологических показателей в контролируемой экспериментальнойситуации — Г-данные (Objective test data). Этот метод предусматривает создание специальных микроситуаций, способствующих проявлению психологических и психофизиологических свойств. В эту группу можно отнести методики: исследования интеллекта и креативности («творческости») памяти, внимания, восприятия, специальных способностей, проективные и другие тесты.
При разработке любых методов или конкретных методик, ориентированных на оценку профессиональной пригодности специалистов, возникают две взаимосвязанные задачи.
Первая задача призвана ответить на вопрос, какие индивидуальные психологические качества определяют профессиональную пригодность.
Вторая задача направлена на решение проблемы, каким способом можно надежно измерить эти необходимые для успешной, деятельности специалиста качества.
Решение первой задачи связано с применением методов профессиографии и психологической диагностики.
Решение второй задачи связано с применением современных технологий разработки или адаптации психологических тестов, с психометрическими основами профессионального психологического отбора.
На основании анализа теоретических и прикладных исследований в области профессионального психологического отбора на рис. 7.2 представлена схема разработки средств измерения и оценки профессиональной пригодности.
Из схемы видно, что процедура создания методики оценки профессиональной пригодности начинается с анализа профессиограммы. В дальнейшем она делится на два взаимосвязанных направления:
- разработка новых или адаптация известных тестов измерения и оценки ПВК;
- разработка методов регистрации параметров деятельности (сбора внешних критериев).
Заканчивается создание методики оценки профессиональной пригодности разработкой нормативно-оценочных шкал ПВК и собственно нормативно-оценочной шкалы (шкал) профессиональной пригодности с обязательной их проверкой цо критериям валидности и надежности.
Ниже рассматриваются некоторые элементы этой схемы.
3.1. Анализ профессиограммы
При проведении анализа профессиограммы в интересах разработки методики оценки профессиональной пригодности решаются две основные задачи:
ü определение перечня ПВК, оказывающих наибольшее влияние на эффективность и Надежность профессиональной деятельности;
ü определение параметров деятельности, характеризующих эффективность и надежность деятельности человека.
Определение перечня ПВК, основных параметров деятельности связано с содержательным анализом профессиональной деятельности и с задачами профессионального психологического отбора.
В перечень ПВК должны быть включены только основные качества личности, без которых эффективная деятельность невозможна. Необоснованное расширение перечня ПВК (например, почти все социально значимые качества необходимы профессионалу) не только затрудняет разработку методик отбора и последующего ее применения, но и может привести к искажению результатов анализа.
При определении параметров деятельности, характеризующих работу профессионала, необходимо стремиться к поиску объективных показателей, отражающих главные особенности деятельности профессионала. Среди таких параметров могут быть показатели качества, эффективности выполнения человеком ключевых элементов трудового процесса.
3.2. Разработка методик регистрациивнешних критериев
Методики, ориентированные на сбор внешних критериев, разрабатываются на основании выделенных на этапе профессиографии основных параметров деятельности.
Известно два основных подхода к разработке таких методик:
1. Сбор показателей, характеризующих деятельность человека в производственном цикле, например, точность выдерживания параметров глиссады летчиком при посадке самолета.
2. Опрос экспертов.
Первый подход наиболее понятен и требует лишь разработки процедур фиксации и накопления данных. В каждом конкретном случае он решается с учетом специфики исследуемой деятельности. Наиболее часто в качестве критериев используются показатели, характеризующие меру достижения работником целей деятельности. Критерий при этом могут быть прямыми или косвенными. В качестве прямых критериев обычно используют показатели скорости, точности действий, ошибочные действия и т. д. В качестве косвенных критериев находят широкое применение оценки на экзаменах, показатели, характеризующие уровень профессиональных знаний, навыков или вклад работника в общей результат деятельности.
Второй подход основан на применении экспертных методов и требует от разработчиков-знаний по их применению. Этот подход применяется достаточно часто, особенно когда внешние критерии трудно получить другим путем. Например, при оценке добросовестности, исполнительности.
Обычно выделяются два основных метода получения экспертных оценок:
Непосредственное прямое оценивание измеряемого свойства.
Приписывание оценки по измеряемому признаку на основе совокупности косвенных данных.
Прямое измерение. В простейшем случае оценка измеряемого признака экспертом производится путем выбора, как правило, одного ответа из серии предложенных или путем выбора одного числового балла из некоторой совокупности чисел. В качестве индикатора данного свойства может служить вопрос, обращенный к эксперту: «Выполняет ли Иванов работу без брака?» При этом предполагаются варианты ответов: постоянно, довольно часто» редко, никогда. Ответам приписываются числовые оценки — соответственно 4, 3, 2,1. Иногда удобно для оценки измеряемого качества использовать графические шкалы. Такая шкала представляет собой отрезок прямой линии (например, длиной в 10 см), разделенный на равные части и снабженный словесными или числовыми обозначениями. Такова, например, методика Осгуда, которая предполагает выяснение семантической близости любых пар понятий.
Ранжирование объектов. Ранжирование объектов является другим широко используемым приемом измерения. При ранжировании производится оценивание по измеряемому качеству совокупности объектов путем их упорядочивания по степени выраженности данного признака. Первое место, как правило, соответствует наиболее высокому уровню. Каждому объекту приписывается оценка, равная его месту в данном ранжированном ряду. Например, для оценки добросовестности в конкретной группе можно попросить эксперта проранжировать (упорядочить) по этому качеству всех членов группы.
Метод парных сравнений. Сущность метода состоит в трм, чтобы предложить нескольким экспертам произвести сравнение объектов попарно, с тем чтобы установить в каждой паре наиболее значимый из них. Одним из главных требований к методике является тщательная формулировка инструкции для экспертов, где суть заданий должна быть изложена просто и ясно. Например, требуется шести экспертам оценить пять человек по степени их добросовестности. Обозначим каждого оцениваемого индивида символами A1A2A3A4AS. Из символов образуем всевозможные пары: (Aj А_), (А_ А,) и т. д. Всего.таких парных комбинаций получится 10. Выделенные пары, предъявляются экспертам на отдельных карточках так, чтобы один и тот же индивид не появлялся подряд в двух последовательно идущих карточках. Результаты опроса сводятся в таблицу. К сожалению, при большом количестве объектов сравнения данный метод оказывается громоздким и в практическом смысле малопригодным.
Метод равных интервалов. Основная идея и отличие данного метода от метода парных сравнений заключается в том, что большой список суждений об изучаемом объекте оценивается экспертами, которые, располагают признаки (суждения) в фиксированное число категорий (обычно равное 7, 9 или 11), ранжированных по степени предпочтения. Интервалы между категориями должны быть субъективно равными, т. е. эксперту должно казаться, что различия по степени предпочтения между суждениями любых двух смежных категорий равны. При создании оценочной шкалы на основе данного метода прежде всего сюуществляется сбор несколько сот различных мнений, связанных с объектом оценки. В задачу исследователя входит получение всевозможных оттенков мнений по интересующему вопросу, причем формулировки этих мнений должны быть самыми разнообразными по своему словарному запасу.
Например, если исследуется отношение студента к учебе в учебном заведении, то могут быть высказаны такие суждения.
Ø Учусь, потому что хочу больше знать.
Ø Все учатся, и я учусь.
Ø Учусь, потому что интересно.
Ø Учиться заставляют близкие.
Ø Я и сам не знаю, зачем учусь.
Ø Это позволит исполнить мою мечту, овладеть желаемой профессией.
Ø Учусь, чтобы иметь возможность и дальше продолжить образование.
Ø Учеба позволит мне достигнуть материального благополучия (и т. д.).
Из выписанного списка суждений отбирается 100 и более, которые по возможности равномерно покрывают весь континуум установки: от мнений, выражающих крайнее положительное отношение к объекту установки, до мнений, выражающих крайнее отрицательное отношение к этому объекту. Особое внимание уделяется формулировке нейтральных мнений. При отборе суждений необходимо руководствоваться следующими правилами:
Ø суждения формулируются в утвердительной форме и должны выражать сиюминутную психологическую установку испытуемого, не смешивая ее с отношением к тому же объекту в прошлом;
Ø каждое суждение должно быть достаточно кратким, чтобы не утомлять опрашиваемых;
Ø суждения должны быть сформулированы таким образом, чтобы их можно было принять или отвергнуть, и выражать они должны одну, а не несколько идей, необходимо избегать утверждений, по отношению к которым большинство респондентов не имеют определенного мнения;
Ø суждения должны иметь такую форму, чтобы согласие или несогласие с ними указало на их отношение к объекту установки;
Ø суждения не должны быть двусмысленными или неопределенными;
Ø характер суждений не должен быть фактическим;
Ø необходимо исключать утверждения, которые могут быть приняты как теми, кто имеет отрицательное отношение к объекту установки, так и теми, кто имеет положительную установку.
Далее каждое утверждение, отобранное по перечисленным выше критериям, заносится на отдельную карточку и затем предъявляется группе экспертов для упорядочения. Экспертов просят независимо друг от друга разложить карточки на 7, 9 или 11 групп так, чтобы в группу с наибольшим номером помещались карточки с утверждениями, которые соответствуют максимально положительной установке индивида, в первую группу помещаются карточки с утверждениями, соответствующими максимально негативной установке к объекту исследования, в среднюю группу помещаются карточки с нейтральными утверждениями. Необходимо обращать внимание на то, чтобы расстояния между любыми двумя соседними группами карточек были субъективно равными.
После того как сортировка карточек произведена, необхо мо оценить каждое суждение с точки зрения его соответств шкале, отобрать наиболее приемлемые и установить вес сух ния на шкале — присвоить определенное числовое значение.
Метод суммарных оценок (шкала Лайкерта). Суть метода: гр- пе лиц даются вопросы, которые должны оцениваться по 5-балльн системе в отношении согласия с этими вопросами (суждениями);
— полностью согласен;
— согласен;
— нейтрален;
— не согласен;
— полностью не согласен.
Баллы одного лица относительно всех вопросов суммируютА ся. Полученная сумма — балл этого лица. Затем лица ранжируются по баллам.
Шкалограммный анализ Гуттмана. Эта техника связана с построением одномерных шкал, т. е. шкал, не затрагивающих вопросов или не включающих факторов, посторонних по отног. нию к измеряемой характеристике. Основная идея метода состой ит в том, что шкала должна состоять из иерархизированной системы вопросов, т. е. такой, в которой согласие с вышестоящим по иерархии суждением должно вести к согласию с нижестоящими суждениями. Например, утверждение о том, что кандидатА имеет высшее образование, говорит о том, что он учился в вузе, Щ также о том, что он закончил среднюю школу.
К сожалению, все экспертные методы получения внешних критериев имеют общие недостатки, которые являются источвдщ ком ошибок измерения соответствующих показателей профессиональной успешности. К ним прежде всего относится так называемый «галло-эффект», состоящий в тенденции оценивать человека v сходным образом по нескольким независимым шкалам в зависимости от общего (благоприятного или неблагоприятного) отношения оценивающего к оцениваемому. Галло-эффект есть следствие несло-. собности к дифференциации различных особенностей личности,подлежащих оценке. Он проявляется в высоких корреляциях оценок различных аспектов профессиональной деятельности. Галло-эффект может быть также следствием небрежности. Другим существенным недостатком являются различия в распределении оценок, даваемых разными экспертами. Одни склонны к их завышению, другие — к занижению. Поэтому один и тот же балл у разных экспертов может иметь различное значение. Отсюда следует, что баллы различных экспертов не могут суммироваться и усредняться.
Указанные недостатки явились причиной поиска более совершенных способов оценки. Один из них — дополнение баллов описанием типичных особенностей поведения, соответствующих различным градациям показателя профессиональной успешности. Это позволяет в некоторой степени стандартизировать значение балльных оценок и уменьшить ошибки измерения, связанные с различным толкованием баллов. Существуют также другие способы улучшения экспертных оценок, описание которых можно найти в специальной литературе.
Резюмируя сказанное, отметим некоторые правила, следуя которым, можно добиться снижения искажений внешнего критерия на основе экспертных оценок:
Ø особенности личности, подлежащие оценке, должны быть определены достаточно четко и однозначно;
Ø если необходимо оценить группу испытуемых по нескольким свойствам, то рекомендуется оценивать всю группу поочередно по каждому свойству личности (не рекомендуется оценивать испытуемого сразу по всем свойствам, так как это усиливает галло-эффект);
Ø рекомендуется разъяснить экспертам сущность галло-эффекта и подчеркивать необходимость его устранения;
Ø достоверность измерения повышается при обобщении независимых оценок нескольких экспертов;
Ø подготовленные и обученные эксперты дают более достоверные оценки;
Ø точность оценок выше при продолжительном наблюдении, проводимом в различных обстоятельствах и ситуациях.
В заключение следует отметить, что к внешним критериям, независимо от метода их получения, предъявляется ряд общих требований.
Прежде всего они должны быть релевантными, т. е. обеспечивать значимость критерия как показателя эффективности профессиональной деятельности. Избранные критерии должны отражать все значимые стороны профессиональной деятельности (полнота критерия). Критерии должны проверяться на надежность, т. е. на устойчивость, стабильность характеристик профессиональной деятельности. Надежность может оцениваться корреляцией повторных замеров критерия, проведенных с различными интервалами времени. Выбранный критерий должен различать специалистов с высокой и низкой профессиональной пригодностью (дискриминантность критерия).
В настоящее время многие авторы считают неприемлемыми глобальные оценки профессиональной пригодности. Установлено, что показатели профессиональной успешности зависят не от одного, а от нескольких факторов. Считается, что каждый фактор профессиональной успешности должен прогнозироваться отдельно, а заключение о пригодности должно выноситься с учетом всех факторов профессиональной деятельности.
Необходимо учитывать также динамичность критериев, которая состоит в изменении их факторной структуры и валидности тестов относительно различных периодов становления профессиональной деятельности. Динамичность критериев связана с изменением психофизиологической и психологической структуры навыков и приемов работы в процессе обучения и накопления последующего профессионального опыта. Практическое значение динамичности критериев состоит в том, что прогноз профессиональной успешности в различные периоды обучения и деятельности может быть связан с показателями различных тестов.
Стандартность процедуры тестирования
Понятие «тест» имеет два основных толкования. Одно из них рассматривает тест как эмпирико-аналитическую процедуру, удовлетворяющую критериям научного познания. Другое — как систему заданий, предъявляемых испытуемым с целью получения надежной и валидной информации об интересующих признаках. Первое толкование имеет меньшее распространение, для его выражения чаще используется термин «тестирование», понимаемое как стандартизованное измерение индивидуальных различий. Собственно «тест» рассматривается как средство для осуществления этого измерения. Тест представляет собой стандартный набор заданий и должен применяться в стандартных условиях:
Ø всем испытуемым должны предъявляться одинаковые стимулы и предоставляться одинаковый набор возможных реакций;
Ø указания и инструкции сообщаются испытуемым одинаковым образом, желательно письменно;
Ø текст указаний должен быть построен в простых выражениях, доступных пониманию всех;
Ø ни одному испытуемому не должно даваться никаких преимуществ перед другими;
Ø заранее разработанная система оценки тестовых результатов применяется ко всем испытуемым без исключения;
Ø тестирование различных групп испытуемых должно проводиться по возможности в одинаковое время дня; в сходных условиях;
Ø в процессе тестирования нежелательно присутствие посторонних лиц, особенно представителей администрации, педагогов и других значимых (для испытуемого) лиц;
Ø эксперт не должен делать пояснений в процессе тестирования;
Ø инструкция и смысл каждого задания должны быть понятны каждому испытуемому (соответствие теста этомутребованию должно тщательно проверяться на этапе его создания);
Ø в сравнительных исследованиях необходимо стремиться к выравниванию групп по уровню мотивации (различная мотивация, как недостаточная, так и чрезмерная, дает смещенные результаты).
Данные тестирования обрабатываются на ЭВМ по стандартным статистическим программам. Высокий уровень стандартизации на всех этапах сбора и обработки информации обеспечивает сопоставимость тестовых результатов и возможность содержательного анализа данных.
Анализ результатов тестирования строится на основе представлений о сущности теста, о его связи с теми явлениями, которые предполагается оценить. Тесты могут быть предназначены для измерения одного (гомогенные шкалы) или нескольких (гетерогенные шкалы) признаков. Качество теста зависит от содержания заданий и от структуры теста. Каждое задание, входящее в состав теста, является эмпирическим индикатором того свойства, на оценку которого направлен данный тест или данная шкала гетерогенного теста. Количество эмпирических индикаторов, необходимое дли получения достоверной оценки исследуемого признака, определяется исходя из двух положений:
точность измерения, как правило, увеличивается с увеличением количества заданий;
значительное увеличение количества заданий приводит к развитию смещения тестовых результатов, связанному со снижением мотивации обследуемых, утомлением, отвлечением внимания..
Для гомогенного теста количество заданий считается:
минимальным — 10;
достаточным — 23-29; |
практически оптимальным — 30-40;
теоретически желаемым — свыше 40.
В гетерогенном тесте, состоящем из т гомогенных шкал, примерное число заданий увеличивается в т раз.
Тесты вызывают у разных людей различное отношение: позитивное, негативное, смешанное, индифферентное.
Достоверность результатов измерения во многом зависит от желания испытуемого сотрудничать с экспертом. Важнейшую роль в формировании этого желания играет инструкция. Стиль текста инструкции должен быть выдержан в уважительном, приглашающем, располагающем тоне. Истинная цель и подлинные задачи исследования испытуемым сообщаются в общих выражениях, в более абстрактных понятиях по отношению к предмету измерения, но из той же области знаний. Излишняя конкретизация может вызвать искажение результатов за счет установочного поведения испытуемых. Инструкция должна быть краткой, ясной и полной, охватывать все основные вопросы поведения испытуемых в процессе тестирования.
Требование ясности и понятности относится и к самим тестовым заданиям/ Особенно это касается опросников и анкет. Высказывания должны быть по возможности короткими, содержать не более одного придаточного предложения. Они не должны вызывать необходимости пояснений и уточнений., В инструкции следует подчеркнуть, что на тестовое высказывание надо отвечать в общем, не вдаваясь в излишние детали и конкретизацию. Высказывания не должны содержать узконаучных терминов, иностранных слов, малораспространенных оборотов речи. Нежелательно использовать в тестовых высказываниях обороты с отрицанием «не», например: «Не думаю, что родители всегда правы». В этом случае испытуемый, считающий, что родители всегда правы, должен ответить «неверно», т. е. осуществить логи- v ческую операцию «двойное отрицание». Это значительно затрудняет работу с опросником и повышает вероятность выбора ошибочного ответа. В каждом высказывании должно утверждаться что- нибудь одно, поскольку отношение испытуемого к различным элементам перечня (например: «Мне нравятся книги Л. Толстого,А. Чехова и И. Тургенева») может быть различным, а ответ «верно» предполагает положительное отношение ко всему перечисленному.
Имеет значение форма, в которой представлены тестовые высказывания. Например, испытуемые более охотно и искренне работают с опросниками, в которых тестовые высказывания сформулированы не в виде вопросов, а в виде суждений, к которым предлагается выразить свое отношение («согласен» — «не согласен»). Такая формулировка позволяет несколько снизить защитную реакцию испытуемых, вызванную попыткой вторжения в их внутренний мир.
Вопросы или тестовые высказывания могут быть «закрытыми» и «открытыми». В 1-м случае испытуемому предлагаются уже сформулированные варианты ответов, из которых необходимо выбрать один правильный. Количество ответов на каждое высказывание колеблется» как правило, от 2 до 7. «Ступенчатость», конкретная градуировка шкалы ответов определяется задачей исследования*, характером изучаемого признака, содержанием тестовых высказываний и особенностями методов предполагаемой статистической обработки. «Открытые» тестовые высказывания предполагают получение ответа в произвольной форме, испытуемые не ставятся в ситуацию вынужденного выбора.
Тесты должны быть сбалансированы по числу позитивных и негативных высказываний. В противном случае, у испытуемых развиваются защитные реакции по типу «лакировки» действительности или преподнесений себя в более выгодном свете.
3.4. Надежность и валидность тестов
Надежность и валидность психодиагностических тестов являются основными критериями качества методик и возможности их использования в профессиональном отборе. В психодиагностике термин «надежность» означает устойчивость или постоянство оценок, получаемых испытуемым при повторных исследованиях.
Надежность и валидность измеряются статистически. Существуют следующие подходы к оценке надежности тестов.
Повторное тестирование (тест-ретест надежность) — проведение повторного обследования через определенное время (1-3 месяца) и сопоставление полученных результатов. Если результаты изменились — проводится статистическая проверка: расчет средних значений, оценка достоверности различий, вычисление коэффициента корреляции. При отсутствии статистически значимых различий распределений оценок при 1-м и 2-м обследованиях и наличии высокой корреляционной связи между этими оценками можно утверждать, что тестовые результаты являются устойчивыми, стабильными и воспроизводимыми. Коэффициент корреляции в этом случае называется коэффициентом надежности (г.х).
Параллельное тестирование — проведение обследования с использованием параллельных (эквивалентных) форм теста и сопоставление полученных результатов. Получаемый в этом случае коэффициент надежности обычно называется коэффициентом эквивалентности. Если интервал между предъявлением параллельных форм был достаточно велик (дни, недели й т. д.), этот коэффициент называется коэффициентом эквивалентности и стабильности. Трудность этого подхода связана с необходимостью разработки эквивалентных форм тестов и доказательства тождественности оценок, получаемых с их помощью. Эквивалентные формы должны быть выровнены по содержанию (психологическому смыслу) каждого тестового высказывания, по внутренней структуре связей тестовых высказываний, по значениям средних и дисперсий тестовых оценок.
Метод раздельного коррелирования — разделение теста на две эквивалентные части и сопоставление результатов выполнения каждой из этих частей. Коэффициент корреляции между результатами выполнения отдельных частей называется коэффициентом внутренней состоятельности теста (г1/2). Метод раздельного коррелирования может быть применен не только для половин теста, но и для отдельных тестовых заданий.
Надежность — необходимый, но недостаточный критерий качества психодиагностического теста. Важное значение имеет второй критерий — валидность теста. В общем виде валидность рассматривается как способность теста измерять то, что он должен измерять по замыслу. Понятие валидности поэтому относится не столько к самому тесту, сколько к цели, условиям и процедуре его применения. Тест может быть надежным, но невалидным для той или иной цели. Валидные тесты — обязательно надежны. Проблема валидности решается только путем эмпирической проверки соответствия тестовых результатов фактам действительности. Сложность проблемы валидности в психодиагностике заключается в том, что получение достоверных фактов о психических явлениях представляет собой трудную задачу, т. е. в данной области исследований факты действительности не являются такими очевидными, как, например, в геометрии или физике. На начальных этапах развития психодиагностики распространенным способом обоснования валидности тестов являлись ссылки на мнение известных ученых, которые, в свою очередь, основывались на собственной интуиции. Такой подход называется «валидизация по авторитету». Ограниченность этого подхода вполне понятна. Субъективизм, даже подкрепленный авторитетом, остается субъективизмом.
Научный подход к валидизации тестов основывается в первую очередь на анализе соответствия между содержанием теста и сущностью изучаемой (с помощью этого теста) проблемы. Содержание теста, смысл тестовых высказываний должны быть нацелены на выявление специфических черт, имеющих отношение к оцениваемому свойству, отражать существенные стороны исследуемого признака. Репрезентативность (представительность) содержания теста в структуре исследуемого признака рассматривается как основа валидизации теста по содержанию. Исследование того или иного явления с помощью тестов осуществляется, как правило, не «в лоб», не путем прямых вопросов, а по косвенным признакам, по некоторым эмпирическим индикаторам. Естественно, качество теста будет зависеть от того, насколько полно представлены основные стороны исследуемого признака этими эмпирическими индикаторами.
Концептуальная валидность является мерой соответствия показателя теста теоретическим представлениям о сущности измеряемых свойств. Исходным пунктом концептуальной валидизации служит анализ основных понятий. Одним из методов такого анализа является операционализация понятий. Операционализация позволяет расчленить, уточнить и детализировать основное понятие, поставить ему в соответствие некоторый набор понятийных и эмпирических индикаторов. Следующим этапом валидизации служит применение приемлемых эмпирических методов подтверждения соответствия выработанной концепции реальной действительности. Одним из широко распространенных средств структурирования эмпирических индикаторов является факторный анализ, позволяющий выделить в нагромождении разрозненных фактов определенную более или менее непротиворечивую логическую структуру. Если большинство концептуально выделенных индикаторов (тестовых высказываний) образуют концептуально предполагавшиеся факторы-понятия, то результат факторного анализа следует рассматривать как подтверждение концептуальной валидности теста.
Критериальная валидность указывает на соответствие тестовых показателей определенным оценкам успешности профессиональной деятельности — «внешнему критерию». Можно выделить три эмпирических подхода к валидизации тестов по внешнему критерию.
Прогностический подход — тестирование кандидатов, поступающих на работу, и сопоставление тестовых результатов с результатами овладения профессией и успешностью последующей профессиональной деятельности. Мерой критериальной, в данном случае — прогностической валидности будет являться коэффициент корреляции между тестовыми оценками и показателями трудовых достижений. Высокие значения коэффициента валидности указывают на возможность применения данного теста для прогнозирования профессиональной пригодности кандидатов к той или иной деятельности.
Прогностическая валидность ограничена тем интервалом времени, который разделяет момент обследования и момент получения оценок внешнего критерия. Этот интервал называется глубиной прогноза.
Конкурентный подход — тестирование работающих специалистов и сопоставление тестовых оценок с трудовыми достижениями испытуемых. Мерой конкурентной валидности также является коэффициент корреляции. Высокие значения этого коэффициента указывают на валидность тестов в отношении измерения имеющихся трудовых достижений специалиста. Предполагается, что эти же тесты должны быть валидными в отношении прогнозирования трудовых достижений кандидата на работу.
Третий подход основывается на сравнении тестовых результатов в известных контрастных {полярных) группах. Если тестовые результаты в этих группах достоверно различаются, то можно с определенной вероятностью предполагать, что тест обладает дискриминантной способностью и позволяет различать «лучших» и «худших» по интересующему признаку (например, по успешности профессиональной деятельности).
Валидность теста обладает ситуационной специфичностью. Рассчитанная в определенных условиях, на основе сопоставления с конкретным критерием успешности деятельности, она может существенно изменяться при отклонении от этих условий, при использовании другого критерия. Установление ситуационной специфичности валидности послужило импульсом для разработки теоретической концепции синтетической валидности. Эта концепция заключается в поиске соответствия тестовых оценок не глобальным критериям успешности профессиональной деятельности, а частным критериям, показателям успешности выполнения отдельных операций (действий), устанавливаются весовые коэффициенты вклада отдельных элементов деятельности в общий результат деятельности. После этого так называемые «элементные» валидности синтезируются в оценку валидности относительно глобальных критериев профессиональной успешности.
Вопросыдля самоконтроля
4. Дайте определения и приведите классификации профессионально важных качеств.
5. Какие критерии успешности профессиональной деятельности специалистов вы знаете?
Задание для самостоятельной подготовки
Используя приведенные в предыдущих темах методики психологического и психофизиологического обследования, самостоятельно подберите батарею тестов, наиболее полно оценивающих специалистов по составленной вами профессиограмме.
Используя методику экспертной оценки успешности профессиональной деятельности (с. 507), оцените эффективность работы ваших специалистов.
Вопросы для тестового контроля знаний
1. Объективные измерения психологических и психофизиологических показателей называются:
а) 1,-данные;
б) Q-данные;
в) Г-данные;
г) все ответы верны;
д) все ответы неверны.
2. Процедура создания методики оценки профессиональной пригодности включает:
а) анализ профессиограммы;
б) разработку новых или адаптация известных тестов измерения и оценки ПВК;
в) разработку методов регистрации параметров деятельности (сбора) внешних критериев;
г) разработку нормативно-оценочных шкал ПВК и шкалы (шкал) профессиональной пригодности;
д) все ответы верны;
е) все ответы неверны.
3. Тенденция оценивать человека сходным образом по нескольким независимым шкалам в зависимости от общего (благоприятного или неблагоприятного) отношения оценивающего к оцениваемому называется:
а) шкалограммный анализ Гуттмана;
б) шкала Лайкерта;
в) галло-эффект;
г) метод равных интервалов;
д) метод парных сравнений;
е) все ответы верны;
ж) все ответы неверны.
4. Оптимальное количество заданий для гомогенного теста составляет:
а) 10;
б)23-29;
в) 30-40;
г) свыше 40.
5. Надежность психодиагностических тестов проверяется методами:
а) повторного тестирования, параллельного тестирования, раздельного коррелирования;
б) оценки теста по содержанию, концептуальному соответствию показателя теста теоретическим представлениям о сущности измеряемых двойств, критериальному соответствию тестовых показателей определенным оценкам успешности профессиональной деятельности, прогностичности тестирования;
в) все ответы верны;
г) все ответы неверны.
6. Валидность психодиагностических тестов проверяется методами:а) повторного тестирования, параллельного тестирования, раздельного коррелирования;
б) оценки теста по содержанию, концептуальному соответствию показателя теста теоретическим представлениям о сущности измеряемых свойств, критериальному соответствию тестовых показателей определенным оценкам успешности профессиональной деятельности, прогностичности тестирования;
в) все ответы верны;
г) все ответы неверны.
Рекомендуемая литература
1. Анохин П.К. Узловые вопросы теории функциональной системы. М.: Наука 1980. 289 с.
2. Введение в эргономику / Под ред. В.П. Зинченко. М.: Советское радио,1974.
3. Виноградов BJ3. Гормоны адаптации и системные реакции организма. Минск, 1989. 222 с.
4. Зараковский ГМ., Павлов BJB. Закономерности функционирования эргатических систем. М.: Радио и связь, 1987. 232 с.
5. Иванова ЕМ. Психотехнология изучения человека в трудовой деятельности. М.: Изд-во МГУ, 1992.
6. Котик МЛ. Курс инженерной психологии. Таллин: Вал- гус, 1978.
7. Краткий психологический словарь. М., 1998. С. 347-348,373.
8. Кулагин Б.В. Основы профессиональной психодиагностики. Л.: Медицина, 1984. 216 с.
9. Леонтьев АЛ. Деятельность, сознание, личность. М.: Политиздат, 1975. 304 с.
10. Ломов Б.Ф. Методологические и теоретические проблемы психологии. М.: Наука, 1984. 444 с.
11..Медведев В.И., Леонова А.Б. Функциональные состояния человека // Физиология трудовой деятельности. СПб.: Наука,
12. Общая психология / Под ред. А.В. Петровского. М.: Просвещение, 1976.
13. Основы физиологии функциональных систем / Под ред. К.В. Судакова. М.: Медицина, 1983. 272 с.
14. Романова Е.С., Суворова ГЛ. Психологические основы профессиографии. М.: Изд-во Моск. пед. гос. ун-та им. В. И. Ленина, 1990. |
15. Рубинштейн СЛ. Основы общей психологии: В 2 т. М., 1989.
16. Справочник по прикладной эргономике. М.: Машиностроение, 1980.
17. Человеческий фактор / Под ред. Г. Салвенди. Пер. с англ. М.: Мир, 1991. Т. 4. 496 с.
18. Шадриков В Д. Деятельность и способности. М.: Логос, 1994.