У соціології надійність вимірювання має кілька аспектів.
Одні соціологи під надійністю розуміють якість усього соціологічного дослідження, тобто такого дослідження, результатам якого можна довіряти.
Інші соціологи поняття надійність відносять до вимірювальної процедури, а точніше, до вимірювального інструменту. У деяких випадках використовується поняття достовірність.
Надійність вимірювання та надійність відбору - два аспекти надійності соціологічної інформації.
Надійність інструменту і, отже, надійність даних, одержуваних за допомогою цього інструменту, припускає досягнення при шкалювані таких вимог як:
1) обгрунтованість;
2) стійкість;
3) правильність вимірювання.
Контроль надійності необхідно розглядати в цих трьох аспектах.
Обгрунтованість шкали полягає в тому, що з її допомогою вимірюють цілком визначену властивість або ознаку, не змішуючи її з іншими. Обгрунтованість передбачає впевненість у тому, що вимірюється цілком задана властивість об'єкта, а не щось інше, на неї схоже. Іншими словами, обґрунтованість - це відповідність інструментарію вимірюваній властивості об'єкта.
Необхідною є обгрунтованість теоретична й емпірична. Теоретична обгрунтованість пов'язана зі змістом дослідження, виділенням повного спектру смислових ситуацій, що відображають концепцію дослідження. Емпірична обгрунтованість передбачає отримання надійних даних про властивості об'єкта.
Для підвищення обгрунтованості використовують різні способи. Насамперед, це логічні міркування на основі досвіду і здорового глузду. Такий спосіб контролю відносять до простих.
Наприклад, необхідно виміряти середню інтенсивність перегляду телепередач за допомогою масового опитування. Можна задати питання: "Скільки приблизно годин на день Ви проводите біля телевізора? ". Пропонується 5 інтервалів: або не більше 1 години, від 1 до 2 годин, від 2 до 3 годин, від 3 до 4 годин, понад 4 години. Виникають сумніви в обгрунтованості такого методу. Більш логічно буде виділення будніх, суботніх та недільних днів, а також формулювання питань про те, в які дні і скільки в середньому годин проводять респонденти у ці дні біля телевізора. Таким чином, ми зможемо вирахувати середній час на перегляд.
Використовується також тест з "еталонною групою" – сильніший спосіб. Сенс його полягає в зіставленні даних, отриманих шляхом вимірювання за шкалою, з достовірними відомостями про об'єкти вимірювання.
Так, наприклад, вимір правосвідомості та дотримання прав можна провести шляхом порівняння еталону негативного порядку (правопорушників) й еталону законослухняних громадян.
Перевірка обгрунтованості шкали, вимірювання може бути здійснена за допомогою незалежного критерію, в якості якого виступає фіксована величина, наприклад, самодослідження, самофіксація витрат часу. З таким показником може бути порівняна величина середнього часу перегляду, отримана під час опитування респондентів.
При відборі шкал і їх значень іноді використовується метод суддівства. У якості суддів виступають типові представники основної маси опитуваних. Склад суддів повинен бути репрезентативним за основними соціальними параметрами (стать, вік, рівень освіти, статус тощо).
Правильність виміру, тобто відповідність результату вимірювання якої-небудь величини її істинному значенню. Правильність виміру - це здатність використовуваного інструменту на належному рівні диференціювати (розрізнити) досліджувану сукупність. В іпротилежному випадку може виявитися, що "не працює"якась частина шкали або бракує градацій, тобто розкиду значень.
Якщо відповіді респондентів фіксуються тільки в одному пункті шкали, то це свідчить про її непридатність. Таке може бути в тому випадку, коли пропоновані значення не мають відношення до визначення досліджуваного властивості об'єкта, або вони важкі для сприйняття, або відчувається вплив на респондентів усталеної загальноприйнятої думки. Така шкала нерелевантна.
Нерідко під час опитувань ми бачимо, що використовується тільки частина шкали або один з її полюсів. Таке зустрічається, коли оцінюється завідомо позитивне явище і в шкалах НЕ використовуються негативні оцінки. Те ж може статися в разі, якщо зміст значень змінної нерівноцінний або шкала надмірно дрібно розбита. Респонденту вибирати з більшого числа пропонованих варіантів завжди важко, він звертає увагу на основний, базовий, найбільш зрозумілий варіант.
Таким чином, недостатня правильність вимірювання може проявлятися:
1) у відсутності розкиду у значеннях за шкалою, тобто всі респонденти відзначили один варіант відповіді, що говорить про те, що шкала побудована невірно;
2) коли респондентами використовується лише частина шкали, наприклад, респонденти уникають негативних значень шкали, що говорить про те, що дана частина шкали не працює;
3) у вигляді нерівномірного використання окремих пунктів шкал. Шкальне значення, виражене в балах, не повинно суттєво відрізнятися від сусідніх по частоті або по числу респондентів.
У соціології правильність визначається як відсутність яких-небудь систематичних помилок, зсувів, насамперед, зміщеньв шкалі. Досягнення правильності - це усунення явних порушень у шкалі виміру. Насамперед, перевіряється надійність вимірювання при використанні порядкових оціночних шкал.
Стійкість - повторюваність одержуваних результатів при повторних вимірах, відсутність будь-яких істотних відхилень у них при деякій зміні процедури використання даної шкали.
Стійкість може бути повною, абсолютною і відносною. Повна стійкість характеризується часткою відповідей, що збігаються в ході повторних вимірювань.
Відносна стійкість показує здатність шкали відображати мінливість досліджуваного об'єкта, його вимірюваних властивостей.
Апробується яка-небудь шкала на певній групі респондентів, а через 2-3 тижні та ж група респондентів оцінюється за тією ж анкетою. Після проведення повторного опитування по кожному респонденту проводиться порівняння результатів. Дивляться на повторюваність результатів, таким чином, враховується стійкість. Оцінка стійкості - це відсоток збігу відповідей на питання двох вимірів. Порівняння можна зробити за допомогою такої таблиці:
Шкала | Респонденти, N=50 | Кількість | Підсумок, % | |||||
A | B | C | D | … | (+) | (-) | ||
- | + | + | + | + | ||||
+ | + | - | - | + | ||||
+ | - | + | + | - | ||||
- | - | - | + | + |
Стійкість показує ступінь відповідності між тим, що виміряли і тим, що хочуть виміряти.
Ця проблема має і методичний, і теоретичний аспект. Вона пов'язана з правильністю перекладу теоретичних понять в операціональні, а потім у емпіричні індикатори.
Підвищення стійкості вимірювання досягається за рахунок поліпшення чутливості шкали шляхом підбору оптимального числа її градацій. При мінімальному числі градацій шкала є менш чутливою, але більш надійною, зменшуються можливості помилки. При великій кількості значень шкала буде більш чутливою, але менш надійною, з великим ризиком появи помилок. Рекомендується використовувати стільки градацій в шкалі, щоб помилки були зведені до мінімуму.