Нехай розподіл ознаки (випадкової величини) X в генеральній сукупності є нормальним Будемо думати, що математичне сподівання
(генеральне середнє) відоме. Тоді вибіркова дисперсія повторної вибірки
(її не варто плутати з вибірковою дисперсією
і «виправленою» вибірковою
Рис. 3.3
дисперсією якщо
характеризує варіацію значень ознаки відносно генерального середнього
, то
і
- відносно вибіркового середнього
). Розглянемо статистику
Враховуючи, що
неважко показати, що
і
Розподіл суми квадратів n незалежних випадкових величин
, кожна з яких має стандартний нормальний розподіл
являє собою
з
степенями вільності. Розподіл
не залежить від невідомих параметрів випадкової величини X,
а залежить лише від числа степенів вільності k.
Густина ймовірності розподілу має складний вигляд, і її інтегрування є складним. Складено таблиці для обчислення ймовірності того, що випадкова величина (яка має
-розподіл з k степенями вільності) перевищить деякі критичні значення
, тобто
. В практиці вибіркового спостереження математичне сподівання
, як правило, невідоме, і доводиться мати справу не з
, а з
. Якщо
- повторна вибірка із нормально розподіленої генеральної сукупності, то випадкова величина
(або
) має розподіл
з
степенями вільності. Тому для заданої довірчої ймовірності
можна записати:
(графічно це площина під кривою розподілу між
і
, див. рис. 3.4). Очевидно, що значення
і
визначаються неоднозначно при одному і тому ж значенні заштрихованої площі, яка дорівнює
. Зазвичай
і
вибирають таким чином, щоб ймовірності подій
і
були однаковими, тобто
Перетворивши подвійну нерівність до рівносильного вигляду
, отримаємо формулу довірчої ймовірності для генеральної дисперсії:
, а для середнього квадратичного відхилення:
.
При використанні таблиць значень , отриманих з рівності
, необхідно врахувати, що
,
тому умова рівносильна умові
. Таким чином, значення
і
знаходимо по таблиці із рівностей:
,
.
Тобто при
,
.
◄Приклад 3.8 На основі вибіркових спостережень продуктивності праці 20 робітниць було встановлено, що середнє квадратичне відхилення добового виробітку складає 15 м тканини в годину. Вважаючи, що продуктивність роботи робітниць має нормальний розподіл, знайти межі, в яких з надійністю 0,9 находяться генеральна дисперсія і середнє квадратичне відхилення добового виробітку робітниці.
Розв’язання. Маємо
;
.
При числі степенів свободи =20-1=19 визначимо
і
за таблицею значень для
- розподілу:
і
. Тоді довірчий інтервал для
можна записати у вигляді:
або
,
і для :
або
.
Отже, з надійністю 0,9 дисперсія добового виробітку робітниць знаходиться в межах від 149,5 до 445,6, а її середнє квадратичне відхилення – від 12, 2 до 21,1 метрів тканини за годину.►
Зауваження. Таблиця значень складена при числі степенів вільності
від 1 до 30. При
можна вважати, що випадкова величина
має стандартний нормальний розподіл N (0;1). Тому для визначення
і
необхідно записати, що
, звідки
, і після перетворень:
. Таким чином, при обчисленні довірчого інтервалу при
потрібно вважати
,
, де Ф (
)=
.
Контрольні питання
1. В чому полягає різниця між повторною і безповторною вибірками?
2. Що таке оцінка параметру розподілу?
3. Для чого використовують нерівність Рао-Крамера-Фреше?
4. Як побудувати довірчий інтервал?
5. Які переваги і недоліки методу найменших квадратів знаходження оцінок?