Измерение — установление соответствия между множествами объектов и множеством "стандартных моделей объектов", которые и составляют измерительную шкалу. Термины “измерение” и “шкалирование” употребляются как синонимы. Измерения и шкалы являются инструментами формализации и обобщения эмпирических наблюдений.
Свойства шкал определяются отношениями, заданными на множестве стандартных моделей шкалируемых объектов. Определенным типам шкал (шкала наименований, шкала порядка, шкала интервалов, шкала отношений) соответствуют различные правила, ограничивающие возможные операции со стандартными моделями объектов, способы обработки результатов измерения и их интерпретации. Формальное обоснование и анализ свойств шкал различных типов приведены в работе [13].
Важно, что в ряду шкал - наименований, порядка, интервалов, отношений - увеличивается мощность шкал: качественные измерения сменяются количественными, возрастают возможности оценки свойств объектов, различий и отношений их свойств, применения арифметических операций, статистических мер и критериев, расширяются пределы инвариантности измерений. Более мощные шкалы обладают всеми возможностями шкал менее мощных, что связывает все шкалы в единую систему измерений.
Существуют следующие основные виды измерительных шкал: наименований, порядка, интервалов, отношений.
Рассмотрим особенности каждого типа шкал.
Шкала наименований - получается путём присвоения «имён» объектам. Иными словами, объекты сравниваются друг с другом, и определяется их эквивалентность - неэквивалентность. В результате данной процедуры образуется совокупность классов эквивалентности. Объекты, принадлежащие к одному классу, эквивалентны друг другу и отличны от объектов, относящихся к другим классам. Эквивалентным объектам присваиваются одинаковые имена.
Шкала порядка - образуется, если на множестве реализовано одно бинарное отношение - порядок (отношения «не больше» и «меньше»). На шкале порядка объект может находиться между двумя другими, причём если а>Ь, Ь>с, то а>с. Шкалы порядка приписывают объектам значения ординальных чисел (от лат. ordinalis - порядковый), которые представляют качество объектов, например, положение в последовательности, степень (первый, второй,.. пятый), но не являются количественными, как кардинальные числа, представляющие собственно количество (один, два,.. пять). Ординальные числа фиксируют именно порядок классов, но не расстояния между ними. Так, различие в величине IQ (коэффициент интеллекта) между 40 и 80 не эквивалентно различию между 100 и 140. Эквивалентность различий (расстояний) для пар значений при любых их смещениях по шкале может быть установлена лишь для более высоких шкал - интервалов и отношений, поскольку на них определена функция расстояния. Характерная черта шкал порядка - неопределенность нулевого значения
Шкала интервалов - является первой метрической шкалой. Она определяет величину различий между объектами в проявлении свойства. С помощью шкалы интервалов можно сравнить два объекта. При этом выясняют, насколько более или менее выражено определённое свойство у одного объекта, чем у другого. Интервальная шкала приписывает объектам значения кардинальных чисел, она является собственно количественной шкалой. Свойства шкалы интервалов определяются введением метрики. Метрика — функция, вводящая понятие расстояния между двумя элементами, a, b, множества А.
Шкала отношений - наиболее часто используемая в физике шкала. Идеалом измерительной процедуры является получение таких данных о выраженности свойств объектов, когда можно сказать, во сколько раз один объект больше или меньше другого. Шкала отношений, как наиболее мощная, суммирует все возможности, которыми обладают менее мощные шкалы наименований, порядка и интервалов. На ней определены отношения эквивалентности, равенства, порядка, функции метрики и расстояния. На шкале отношений можно определить равенство и ранговый порядок величин, равенство интервалов и отношений между величинами. Возможность оценки отношения величин - наиболее важная отличительная черта этой шкалы, определившая ее название.
Известные примеры шкалы отношений: массы, длины; температурная шкала Кельвина. Они представляют образцы положительных шкал отношений. На шкале отношений определены все арифметические операции, и к ее значениям применимы любые статистические процедуры.
2. Тестирование как метод психологической диагностики. Основные требования к тесту как инструменту измерения (репрезентативность тестовых норм, надежность и валидность теста).
Тест - предельно стандартизированная методика, предназначенная для постановления индивидуального диагноза.
Для того, чтобы ту или иную методику можно было признать тестом, необходимо, чтобы были выполнены следующие условия:
1. В тесте должна содержаться однозначно трактуемая всеми возможными категориями испытуемых инструкция.
2. В содержании теста обязательно должна присутствовать информация, характеризующая его с точки зрения качества (репрезентативность, надёжность и валидность). Репрезентативность - в описании каждого теста должна быть информация о выборке, периоде стандартизации данного теста. Надёжность - особое внимание уделяется психологическому измерению. Валидность - указывает на то, на сколько данное средство измерения позволяет измерять то, что мы хотим.
3. В тесте должен присутствовать стандартный по своей форме протокол ответов.
4. В тесте должна содержаться стандартная форма предъявления материала испытуемому.
5. Психологический тест должен содержать алгоритмическое описание первичной обработки полученных результатов.
6. Тест должен содержать глобальные и локальные оценочные шкалы.
7. В описании теста должна содержаться интеграция научных результатов для каждой градации использованной оценочной шкалы.
8. В описании теста должна содержаться информация о теоретической базе, которая легла в основу создания теста.
Тест (англ. test — проба, испытание, исследование) — стандартизированное задание, результат выполнения которого позволяет измерить психофизиологические и личностные характеристики, а также знания, умения и навыки испытуемого.
Под надежностью, или релиабильностью, измерения понимается степень надежности, или точности, с какой может быть измерен тот или иной конкретный признак19. Надежность теста характеризует воспроизводимость его результатов. Отметим, что определяя надежность теста, следует иметь в виду, что измерение не может быть стабильнее измеряемой латентной переменной. Если переменная очень лабильна, то ее измерение в принципе не может характеризоваться высокой повторяемостью.
Научно обоснованный тест - это метод, соответствующий установленным стандартам надежности и валидности26. Если тест имеет низкие надежность и валидность, то использовать его нельзя.
Надежность характеризуется коэффициентом надежности. Коэффициент надежности, это корреляционный коэффициент, показывающий степень совпадения результатов тестирования осуществленного в одинаковых условиях одним и тем же тестом.
Валидность теста — это критерий степени достоверности измерения психического свойства (качества, явления), которое хотят измерить с помощью данного теста. По сути, валидность теста — это показатель степени его эффективности и пригодности для измерения нужной нам характеристики.
Различают несколько видов валидности:
· конструктивную валидность;
· валидность по критерию;
· валидность по содержанию;
· прогностическую валидность.
Валидность лучших тестов не превышает 80%. Следует учитывать, что валидность меняется в зависимости от контингента людей, которые подвергаются тестированию, а также характера их будущей деятельности. В результате один и тот же тест может быть высоковалидным для одной ситуации, и совершенно невалидным для другой.
Основные виды валидности тестов.
Конструктивная валидность — это критерий качества теста, используемый при измерении какого-либо сложного психического феномена, имеющего иерархическую структуру, измерить который из-за этого одним актом тестирования невозможно. К примеру, психодиагностика интеллекта невозможна без предварительного определения понятия «интеллект» и его структуры. В данном случае степень соответствия структуры интеллекта структуре теста и будет составлять конструктивную валидность теста. В общем она нацелена на определение точности измерения сложных, устойчивых типов поведения, качеств личности, психических явлений.
Валидность по критерию — это критерий качества теста, с помощью которого можно судить об интересующем аспекте психики конкретной личности в настоящем и будущем. Для его определения сопоставляются результаты тестирования с уровнем развития измеряемого признака, качества личности на практике. Так, для теста на технические способности основным критерием их определения будет выступать техническая деятельность конкретных специалистов, оценка их технических способностей с помощью экспертов, хорошо знающих испытуемых в интересующем аспекте на протяжении достаточно продолжительного времени. Оценка при этом дается по шкале порядковой, интервальной или отношений. В целом, применение теста считается оправданным, если валидность по критерию составляет минимум 0,2-0,25.
Валидность по содержанию — критерий качества теста, используемый при выяснении соответствия его области измеряемых психических явлений. Показывает, насколько полно тест охватывает исследуемое множество измеряемых параметров.
Прогностическая валидность — критерий качества теста, предсказывающий характер развития измеряемого параметра в будущем. Данный вид валидности особенно ценен с практической точки зрения. Однако существенным недостатком критерия является то, что он не учитывает неравномерность развития измеряемого параметра у различных людей в будущем.