Следующим этапом обработки данных является вычисления числовых характеристик выборки. Главные из них: среднее значение, дисперсия, среднее квадратическое значение, моменты.
Так как функцию выборочных значений называют статистикой, то числовые характеристики, вычисленные по выборке, также называют статистиками.
Числовые характеристики, вычисленные по генеральной совокупности, называют параметрами генеральной совокупности.
Выборочное среднее
Для конкретной выборки объема n ее выборочное среднее определяется соотношением
где хi – значение элемента выборки.
Обычно требуется описать статистические свойства произвольных случайных выборок одного объема, а не одной из них. Это значит, что рассматривается математическая модель, которая предполагает достаточно большое количество выборок объема n. В этом случае элементы выборки рассматриваются как независимые случайные величины Хi, принимающие значения хi с одной и тоже плотностью вероятностей f(x), являющейся плотностью вероятностей генеральной совокупности. Тогда выборочное среднее также является случайной величиной , равной
Среднее значение генеральной совокупности, из которой производится выборка, будем называть генеральным средним и обозначать mх. При значительном объеме выборки можно ожидать, что выборочное среднее не будет заметно отличаться от генерального среднего. Поскольку выборочное среднее является случайной величиной, то для нее можно найти математическое ожидание:
Таким образом, математическое ожидание выборочного среднего равно генеральному среднему. В этом случае говорят, что выборочное среднее является несмещенной оценкой генерального среднего. В дальнейшем мы вернемся к этому термину. Так как выборочное среднее является случайной величиной, флуктуирующей вокруг генерального среднего, то желательно оценить эту флуктуацию с помощью дисперсии выборочного среднего. Рассмотрим выборку, объем которой n значительно меньше объема генеральной совокупности N (n << N). Предположим, что при формировании выборки характеристики генеральной совокупности не меняются, что эквивалентно предположению N = ¥. Тогда
Случайные величины Хi и Xj (i¹j) независимы, следовательно,
Подставим полученный результат в формулу для дисперсии:
, где – дисперсия генеральной совокупности. Тогда среднее квадратическое отклонение выборочного среднего равно:
.
Из этой формулы следует, что с увеличением объема выборки флуктуации среднего выборочного около среднего генерального уменьшаются как . Проиллюстрируем сказанное примером. Пусть имеется случайный сигнал с математическим ожиданием и дисперсией, соответственно равными mx = 10, = 9.
Отсчеты сигнала берутся в равноотстоящие моменты времени t1, t2,..., tn.
Так как отсчеты являются случайными величинами, то будем их обозначать X(t1), X(t2),..., X(tn).
Определим количество отсчетов, чтобы среднее квадратическое отклонение оценки математического ожидания сигнала не превысило 1% его математического ожидания. Поскольку mx =10, то нужно, чтобы С другой стороны поэтому или Отсюда получаем, что n ³ 900 отсчетов.
Выборочная дисперсия
По выборочным данным важно знать не только выборочное среднее, но и разброс выборочных значений около выборочного среднего. Если выборочное среднее является оценкой (приближенным значением) генерального среднего, то выборочная дисперсия должна быть оценкой генеральной дисперсии. Выборочная дисперсия для выборки, состоящей из случайных величин , определяется следующим образом:
Используя это представление выборочной дисперсии, найдем ее математическое ожидание
Таким образом, мы получили, что . Это значит, что выборочная дисперсия является смещенной оценкой генеральной дисперсии. Чтобы получить несмещенную оценку, нужно величину умножить на тогда и выборочная дисперсия принимает вид:
=
Итак, мы получили следующий результат. Если в результате n независимых измерений случайной величины Х с неизвестным математическим ожиданием и дисперсией нам нужно по полученным данным определить эти параметры, то следует пользоваться такими оценками:
В случае, если известно математическое ожидание генеральной совокупности mx, то выборочную дисперсию следует вычислять по формуле
=
которая также является несмещенной оценкой.
Относительной оценкой степени разброса случайной величины Х по отношению к выборочному среднему является коэффициент вариации Vстатистического распределения выборки:
.
Часто по выборочным данным нужно знать оценки таких параметров генеральной совокупности как: центрального (начального) момента k – го порядка, коэффициента асимметрии As, эксцесса Ех.
Выборочным центральным (начальным) моментом k – го порядка () называют величину
()
Для оценки отклонения статистического распределения выборки от нормального распределения используют числовые характеристики - выборочный коэффициент асимметрии и выборочный эксцесс .
Выборочным коэффициентом называют число, которое вычисляется по формуле:
.
Выборочным эксцессом статистического распределения называют число
.
Заметим, что представленные формулы записаны с использованием статистического ряда. В случае интервального вариационного ряда эти формулы преобразуются путем введения весов, равных частоте появления варианты хj. Эти характеристики называются взвешенными числовыми характеристиками. Так взвешенный центральный (начальный) момент k – го порядка будет иметь вид:
(),
где nj – частота варианты xj ()