Развитие современной теории выборочного наблюдения началось с простой случайной выборки.
В процессе проведения выборочного наблюдения, как и вообще при анализе данных любого обследования возникают ошибки. Все ошибки выборочного наблюдения подразделяются на ошибки выборки (случайные); ошибки, вызванные отклонением от схемы отбора (неслучайные) и ошибки наблюдения (случайные и неслучайные).
Ошибка отбора приводит к неслучайным ошибкам. Так бывает, если заменяется единицы, попавшие в выборку, другими единицами (например, если вместо отобранного домохозяйства, где в момент прихода исследователя никто не открыл дверь и был проведен опрос соседей, или когда появляются добровольные респонденты и просят, чтобы их опросили). Неслучайные ошибки возникают из-за методов сбора данных (неудобные вопросы, на которые не отвечают правдиво или неоднозначные по формулировке вопросы).
Случайные ошибки - это те ошибки, которые изменяются по вероятностным законам. К случайным относятся ошибки выборки.
В математической теории выборочного метода доказывается, что с увеличением объема выборки вероятность появления больших ошибок и пределы максимально возможной ошибки уменьшаются.
Ошибка выборки или ошибка репрезентативности - это разница между значением показателя, полученного по выборке, и генеральным параметром. Так, ошибка репрезентативности выборочной средней равна , дисперсии .
По выборочному распределению может быть рассчитана средняя квадратическая ошибка репрезентативности:
|
где ε2i - квадрат ошибки выборки для i -той выборки;
fi - число выборок с одинаковым значением выборочной средней.
Теперь выпишем среднее квадратическое отклонение выборочных средних от генеральной средней:
|
Эта формула называется средней ошибкой выборочной средней.
среднюю ошибку выборочной средней.
|
средняя ошибка выборки тем больше, чем больше вариация в генеральной совокупности, и тем меньше, чем больше объем выборки.
Распределение ошибок выборочных средних имеет характер нормального распределения, даже если генеральная совокупность имеет иную форму распределения. Из формулы (5) получаем, что отклонение выборочной средней от генеральной средней равно:
|
Эту формулу еще называют предельной ошибкой выборки
Нормированное отклонение t может быть установлено по таблице "Значение интеграла вероятностей". Для этого необходимо принять определенный уровень вероятности суждения о точности данной выборки. Вероятность, которая принимается при расчете ошибки выборочной характеристики, называется доверительной.