Лекции.Орг


Поиск:




Категории:

Астрономия
Биология
География
Другие языки
Интернет
Информатика
История
Культура
Литература
Логика
Математика
Медицина
Механика
Охрана труда
Педагогика
Политика
Право
Психология
Религия
Риторика
Социология
Спорт
Строительство
Технология
Транспорт
Физика
Философия
Финансы
Химия
Экология
Экономика
Электроника

 

 

 

 


Статистичне зведення та статистичні таблиці




Другою стадією статистичного дослідження є статистичне зведення і групування, оскільки після збору даних, ми повинні їх звести, згрупувати для обробки.

§ Зведення – це комплекс послідовних операцій по узагальненню конкретних поодиноких факторів, які утворюють сукупність, для виявлення типових рис і закономірностей, що належать досліджуваному явищу в цілому.

- Зведення може бути просте і складне.

Просте зведення – це простий підрахунок підсумків первинних статистичних даних.

Складне зведення передбачає групування, види групувальної ознаки, встановлення меж групування, підрахунок групових і узагальнюючих підсумків, а також викладення результатів зведення у вигляді таблиць чи графіків.

 

Тобто, зареєстровані у процесі масового статистичного спостереження значення ознак відбивають увесь діапазон об’єктивно існуючої в сукупності варіації. У розмаїтті поодиноких відомостей губиться загальне, у неістотному і випадковому — закономірне. Перехід від одиничного до загального відбувається завдяки зведенню.

Суть статистичного зведення полягає в тому, що матеріали спостереження класифікують та агрегують. Елементи сукупності за певними ознаками об’єднують у групи, класи, типи, а інформацію про них агрегують як у межах груп, так і в цілому по сукупності. Основне завдання зведення — виявити типові риси та закономірності масових явищ чи процесів.

Зведення є основою подальшого аналізу статистичної інформації. За зведеними даними обчислюють узагальнюючі показники, виконують порівняльний аналіз, а також аналіз причин групових відмінностей, вивчають взаємозв’язки між ознаками.

Складові статистичного зведення такі:

1) розробка програми систематизації та групування даних;

2) обґрунтування системи показників для характеристики груп і сукупності в цілому;

3) проектування макетів таблиць, в яких подаються результати зведення;

4) визначення технологічних схем обробки інформації, програмного забезпечення;

5) підготовка даних до обробки на комп’ютері, формування автоматизованих банків даних;

6) безпосереднє зведення, узагальнення, розрахунок показників.

Програма систематизації та групування даних передбачає вибір групувальних ознак і правил формування груп. Розробка програми, як і обґрунтування системи показників, залежить від мети дослідження, суті явища, яке вивчається, особливостей сукупності, ступеня варіації групувальних ознак.

Найчастіше всі зведення і групування оформлюються у вигляді статистичних таблиць.

§ Статистична таблиця – це форма найбільш раціонального, наочного і систематизованого викладу числових результатів зведення і обробки статистичних матеріалів

Статистичну таблицю можна порівняти з реченням: вона складається з підмета і присудка.

§ Підметом статистичної таблиці називається статистична сукупність або ї частина, яка характеризується числовими показниками.

§ Присудком називається та частина, що вміщає показники, що характеризують досліджувану сукупність та її частини (тобто підмет)

 

 

Статистична таблиця має три заголовки: один зовнішній і два внутрішніх:

 

Зовнішній заголовок розташований вверху таблиці і містить місце, час, мету досліджуваної ознаки.
Групування банків України за величиною статутного фонду на 1 березня 1999 року.

Присудок Підмет Кількість Питома вага Інші ознаки
5,0 – 7,5          
7,5 – 10,0          
10,0 – 12,5          
12,5 – 15,0          
В підсумковому рядку вказується підсумок по конкретній групі.
В цілому

         

 

 

При оформленні курсової слід пам'ятати, що при поданні таблиць в правому кутку пишемо: "Таблиця …(номер)…", по центру – заголовок таблиці. Посилання на таблицю в тексті позначається словом "табл." + номер таблиці. При існуванні великої кількості розділів, при формуванні номеру таблиці вказуємо номер таблиці, потім через крапку – номер розділу, напр. "Таблиця 1.1"

 

Таблиці можуть бути простими, груповими і комбінаційними.

Простими називаються такі таблиці, в підметі яких міститься перелік об'єктів, адміністративних і територіальних одиниць або ряд періодів, дат, охарактеризованих числовими показниками. Прості таблиці є найбільш поширеними.

Групові таблиці – це таблиці, підмет яких містить одиниці досліджуваного об'єкту, згрупованих за певною суттєвою ознакою.

Комбінаційні таблиці – це таблиці, в яких підмет побудований за двома і більше ознаками.

Приклад комбінаційної таблиці.

Групування банків України за величиною статутного фонду на 1 березня 1999 року.
Розмір статутного фонду Прибутковість ативів Кількість Питома вага Інші ознаки
5,0 – 7,5 1,5 – 2,0 2,0 – 2,5 2,5 – 3,0          
Разом            
7,5 – 10,0 1,5 – 2,0 2,0 – 2,5 2,5 – 3,0          
Разом            
             
В цілому по сукупності            

 

Правила складання таблиць:

1) Таблиця повинна бути компактною і мати тільки ті вихідні дані, які безпосередньо відображають досліджуване явище.

2) Заголовок таблиці, назви граф і строчок повинні бути зрозумілими, чіткими, лаконічними і закінченими.

3) В графах допускаються скорочення тільки при необхідності.

4) Таблиця повинна бути замкнута і мати підсумкову строку. Ця підсумкова строка може знаходитись на початку таблиці.

5) Показники, що характеризують один одного, повинні міститися поруч.

6) Графи нумерують арабськими цифрами, підмет – латинськими літерами.

7) Якщо явище повністю відсутнє, то в клітинки, де має бути його кількісне значення ставиться тире. Якщо дослідник не може знайти відомості про певне явище, то в клітинку ставиться три крапки, або "н.в." – немає відомостей. Якщо дана клітинка не заповнюється, то в неї ставиться хрестик чи зірочка.

За видами групування таблиці можуть бути типологічні, структурні і аналітичні (див. лекцію щодо видів групування).

 

Отже, результати статистичного зведення подаються у формі статистичних таблиць, макети яких розроблюються разом з програмою обробки даних.

Макет статистичної таблиці — це комбінація горизонтальних рядків і вертикальних граф, на перетині яких утворюються клітинки. Ліві бічні та верхні клітинки призначені для словесних заголовків — переліку складових сукупності та системи показників, решта — для числових даних. Основний зміст таблиці розкриває її назва (рис. 3.1).

 

 

Таблиця 3

НАЗВА ТАБЛИЦІ (що, де, коли)

Зміст рядків (підмет) Верхні заголовки (присудок)
А         ...
Бічні заголовки          
         
         
         
Підсумковий рядок          

Рис. 3.1. Макет статистичної таблиці

 

На практиці використовуються різні технологічні схеми комп’ютерної обробки первинних даних. Спільними для всіх є дві операції: кодування даних і перенесення їх із документів на технічні носії інформації, наприклад на магнітні диски.

Коди — це умовні ідентифікатори ознак. Централізовано розроблені єдині класифікатори, оформлені у вигляді словників, забезпечують однозначність кодів. Сформовані автоматизовані банки даних уможливлюють багаторазове використання інформації, при цьому поглиблюється аналіз, зменшується кількість помилок.

За формою обробки даних зведення бувають централізованими та децентралізованими.

У статистичній практиці інформація обробляється переважно децентралізовано. Так, у разі обробки статистичної звітності зведення здійснюється від нижчої до вищої ланки управління: звіти підприємств зводяться регіональними статистичними органами, підсумки по регіонах передаються в Держкомстат, де узагальнюються в цілому по країні. Характерні класифікаційні позиції, «розрізи» зведення такі: територіальна ознака (область, місто, район), підпорядкованість (міністерство, відомство), галузі господарської діяльності, форми власності.

Матеріали переписів, одноразових статистичних обстежень, соціологічних опитувань надходять до єдиного центру, де й обробляються. Така форма зведення називається централізованою.

 

Статистичне групування

Одним із найважливіших методів статистики є групування.

§ Під групуванням в статистиці розуміють розподіл одиниць статистичної сукупності на групи, однорідні в якому-небудь суттєвому відношенні.

Воно є якраз той метод і та стадія, пропустивши яку ми не можемо застосовувати інші методи. Тому в статистиці групування використовується для вирішення різних завдань, таких як, наприклад:

- визначення і вивчення структури і структурних зрушень сукупності;

- виявлення соціально-економічних типів явищ і процесів;

- виявлення і характеризування зв'язків і залежностей між явищами та їх ознаками (таке дослідження має назву аналітичної функції групування).

Відповідно до цих трьох функцій розрізняють різні види групування: структурні, типологічні і аналітичні.

Групування, в результаті якого виділяють однорідні групи або типи явищ, як вираз конкретного суспільного процесу називаються типологічними. Прикладом типологічних групувань може бути поділ підприємств за характеристикою видів власності, групування країн за економічним розвитком.

Структурними групуваннями називаються групування, які характеризують розподіл одиниць однотипної сукупності за будь-якою ознакою. Типологічні і структурні групування дуже близькі один до одного: типологічні групування виділяють самі типи, а структурні – вказують питому вагу окремих типів у загальній масі.

Аналітичні групування – це групування, які визначають взаємозв'язок між різними ознаками одиниць статистичної сукупності. За допомогою такого групування можна виявити певні взаємозв'язки між факторними і результативними ознаками. Наприклад, залежність між рівнем кваліфікації працівника та його заробітною працею. Аналітичні групування є дуже складними і для того, щоб зрозуміти, як вони будуються, необхідно чітко виділити факторні і результативні ознаки в досліджуваному явищі.

Можливі змішання цих типів групування.

 

Групування можуть бути прості і комбіновані.

Прості групування – це такі групування, які здійснені на підставі однієї ознаки.

Комбіновані групування – це групування, які здійснені за двома і більше ознаками.

Комбінаційні групування дають можливість комплексного характеризування досліджуваного явища чи процесу.

 

Для того, щоб зробити групування за кількісною ознакою, необхідно визначитися з кількістю груп та з інтервалом групування.

Кількість груп визначається математичними методами. Вона має біти ні занадто малою, ні занадто великою, вони мають не заважати проаналізувати кінцевий результат.

Величина інтервалу , де xmax – максимальне значення, xmin – мінімальне значення, n – кількість груп сукупності.

 

Інтервали можуть бути відкриті і закриті, рівні і нерівні.

Рівні інтервали – інтервали з однаковою різницею між верхньою і нижньою границями кожного проміжку.

Нерівні інтервали – інтервали з різними різницями між верхньою і нижньою границями в різних проміжках.

Відкритий інтервал – інтервал з відсутньою однією із границь (наприклад, більше 100, менше 1).

Закриті інтервали – інтервали, в яких присутні всі границі.

 

Особливим видом групування є класифікація.

§ Класифікацією називається систематизований розподіл явищ і процесів (об'єктів) на визначені групи, класи, розряди на підставі їх подібності і розбіжності.

Класифікації відрізняються від групувань тим, що групувальною основою класифікації є якісна ознака, вони більш стійкі, сталі і стандартні.

Поділ сукупностей на групи, однорідні в тому чи іншому розумінні, пов’язаний з такими діями, як систематизація, типологія, класифікація, групування. Традиційно зазначений поділ виконують за такою схемою: із множини ознак, які описують явище, добирають розмежувальні, а потім сукупність поділяють на групи та підгрупи відповідно до значень цих ознак.

Головний принцип будь-якого поділу ґрунтується на двох положеннях:

1) в один клас, групу об’єднуються елементи певною мірою подібні між собою;

2) ступінь подібності між елементами, які належать до одного класу, значно вищий, ніж між елементами, що належать до різних класів.

У кожному конкретному дослідженні вирішуються три питання:

1) що взяти за основу групування;

2) скільки груп, позицій необхідно виокремити;

3) як розмежувати групи.

Основою групування може бути будь-яка атрибутивна чи кількіcна ознака, що має градації. Таку ознаку називають групувальною. Залежно від складності масового явища (процесу) та мети дослідження групувальних ознак може бути одна, дві й більше.

У статистичній практиці часто вдаються до розбиття сукупностей за атрибутивними ознаками — класифікації та номенклатури. Їх розробляють міжнародні й національні статистичні органи та рекомендують як статистичний стандарт. Здебільшого йдеться про багатоступеневу класифікацію з докладною номенклатурою груп і підгруп, із чітко визначеними вимогами та умовами віднесення елементів сукупності до тієї чи іншої групи.

У міжнародній статистиці відома галузева класифікація видів економічної діяльності, стандартна класифікація занять, стандарт­на торговельна класифікація. Різновидом класифікації є товарні номенклатури, наприклад Брюссельська митна номенклатура.

Кожній класифікаційній позиції надається код (шифр), який замінює її назву і є постійним засобом ідентифікації під час передавання інформації по каналах зв’язку, комп’ютерної обробки тощо. Так, згідно з міжнародним стандартом галузевої класифікації, розробленої статистичною комісією ООН, код виду економічної діяльності складається з чотирьох цифр. Наприклад, 15 5 2 означає:

15 — код галузі обробної промисловості «Виробництво продуктів харчування та напоїв»;

5 — виробництво напоїв;

2 — виробництво вин.

Кожна класифікація є сталою, забезпечуючи порівнянність даних у просторі та часі.

Поряд з класифікацією для висвітлення певних аспектів конкретного дослідження використовують групування, на яке покладаються такі аналітичні функції:

1) вивчення структури та структурних зрушень;

2) визначення типів соціально-економічних явищ, виокремлення однорідних груп і підгруп;

3) виявлення взаємозв’язків між ознаками.

Згідно з цими функціями розрізняють три види групувань: структурне, типологічне, аналітичне.

Структурне групування характеризує склад однорідної сукупності за певними ознаками. Наприклад, склад населення регіону за місцем проживання (табл. 3.1). За даними таблиці з 5,3 млн населення регіону в містах проживає 3,5 або 2/3 загальної кількості. На одного сільського жителя припадають двоє міських. Кожна група характеризується також кількістю та часткою населення працездатного віку, і це поглиблює аналіз структури.

Таблиця 3.1

ПОДІЛ НАСЕЛЕННЯ РЕГІОНУ, млн осіб,
ЗА МІСЦЕМ ПРОЖИВАННЯ

Місце проживання Усе населення У тому числі у працездатному віці
Міста 3,5 2,1
Сільська місцевість 1,8 0,9
Разом 5,3 3,0

 

Різновидом структурних групувань є ряди розподілу (див. розд. 5).

Типологічне групування — це поділ якісно неоднорідної сукупності на класи, соціально-економічні типи, однорідні групи. Основне завдання такого групування — ідентифікація типів. Вибір групувальної ознаки та кількісних міжгрупових меж ґрунтується на всебічному теоретичному аналізі суті явища, його характерних рис та особливостей формування в конкретних умовах часу та простору.

Так, в умовах перехідної економіки в країнах Східної Європи зубожіння населення перетворилося на ключову проблему соціальної політики. Вивчаючи цю проблему, UNICEF (Дитячий Фонд ООН) оцінював бідність і злиденність населення відношенням середньодушового доходу окремих домашніх господарств до такого рівня доходу, який би забезпечив задоволення основних потреб. Межа бідності визначалася на рівні 35% середньої заробітної плати 1989 року, а межа злиденності — на рівні 60% межі бідності.

Дані табл. 3.2 характеризують процес зубожіння населення Болгарії на початку 90-х років.

 

Таблиця 3.2

ДИНАМІКА ЗУБОЖІННЯ НАСЕЛЕННЯ БОЛГАРІЇ, %, по роках

Ступінь зубожіння    
Бідність 13,8 62,3
Злиденність 2,0 32,7

 

Якщо 1990 року за межею бідності перебувало 13,8%, то 1994 року — 62,3%, а у злиденних умовах — 32,7%.

Як бачимо, структурні й типологічні групування описові; вони характеризують структуру сукупності, виокремлюють характерні риси та особливості, але різняться за рівнем якісних відмінностей між групами.

Скориставшись групуванням, можна також виявити наявність та напрям зв’язку між ознаками, з яких одна розглядається як результат, інша — як фактор, що впливає на результат. Висновок про наявність зв’язку можна зробити на підставі комбінаційного поділу за цими ознаками згідно з характером розміщення частот. Так, за даними табл. 3.3 намір змінити професію найближчим часом мають переважно незадоволені умовами праці (15 із 22), і, навпаки, серед задоволених більшість (26 із 35) зовсім не планує змінювати свій професійний статус.

Таблиця 3.3

КОМБІНАЦІЙНИЙ ПОДІЛ РОБІТНИКІВ

Ступінь задоволеності умовами праці Чи маєте намір змінити професію?
Так, найближчим часом Так, у перспективі Ні Разом
Задоволений      
Не визначився        
Незадоволений      
Разом        

 

Якщо результативна ознака кількісна, для кожної групи за факторною ознакою можна визначити середнє значення результативної ознаки. За наявності зв’язку між ознаками групові середні результативної ознаки систематично змінюються від групи до групи (збільшуються чи зменшуються). Таке групування нази-
вається аналітичним. Очевидно, аналітичне групування докладніше й виразніше, ніж комбінаційний поділ, описує зв’язок між ознаками. Приклад аналітичного групування наведено в табл. 3.4. Основа групування — термін збирання врожаю озимої пшениці після настання повної стиглості зерна (факторна ознака). Кожна група характеризується розміром посівної площі, з якої зібрано врожай, та середньою врожайністю (результативна ознака). Таблиця показує: чим більший термін збирання врожаю, тим менша врожайність і більші втрати зерна. Різниця врожайності між першою і третьою групами становить 20 ц/га.

Таблиця 3.4

ЗАЛЕЖНІСТЬ УРОЖАЙНОСТІ ОЗИМОЇ ПШЕНИЦІ
ВІД ТЕРМІНУ ЗБИРАННЯ

Термін збирання Збиральна посівна площа, га Урожайність, ц/га
Своєчасно    
З незначним запізненням    
Зі значним запізненням    
У цілому по сукупності    

Зауважимо, що поділ групувань на три види певною мірою відносний. Адже часто групування універсальні: одночасно виділяються типи, визначається склад сукупності й виявляється взаємозв’язок між ознаками.

Якщо групувальна ознака неперервна, постає питання про кількість груп та межі кожної з них. Кількість груп залежить від ступеня варіації групувальної ознаки та обсягу сукупності. Так, для дискретної ознаки, діапазон варіації якої обмежений (кількість дітей у сім’ї, тарифний розряд тощо), груп, як правило, стільки, скільки варіант ознаки. У разі значної варіації дискретної ознаки (кількість працюючих на підприємстві, кількість укладених на біржі угод), як і неперервної (стаж роботи працівника, собівартість продукції), діапазон варіації розбивається на m інтервалів.

Орієнтовно оптимальна кількість груп визначається за стандартними процедурами, зокрема за формулою Стерджеса:

m = 1 + 2,30259 lg n,

де n — обсяг сукупності; m — число інтервалів.

Інтервали являють собою каркас групувань. На практиці їх утворюють за трьома формальними принципами: рівності інтервалів; кратності інтервалів; рівності частот.

У структурних і аналітичних групуваннях найчастіше застосовують принцип рівності інтервалів. Ширина кожного інтервалу залежить від діапазону варіації ознаки х та обґрунтованого числа груп (інтервалів) m:

.

Визначаючи межі інтервалів, ширину h доцільно округлювати, самі межі слід позначати з такою точністю, щоб поділ елементів сукупності на групи був однозначним.

Якщо діапазон варіації ознаки надто широкий і поділ значень нерівномірний, беруть нерівні інтервали, зокрема сформовані за принципом кратності, коли ширина кожного наступного інтервалу в k раз більша (менша), ніж попереднього.

Припустимо, що прибутковість активів комерційних банків коливається від 1 до 42%, а прибутковість капіталу — від 11 до 165%. За кожною ознакою утворимо чотири групи (m = 4), скориставшись за прибутковістю активів принципом рівних інтервалів, тобто h = (42 – 1): 4» 10, а за прибутковістю капіталу — принципом кратності інтервалів (k = 2). Варіанти розбиття на групи ілюструє табл. 3.5.

Таблиця 3.5 ВАРІАНТИ ФОРМУВАННЯ ІНТЕРВАЛІВ ГРУПУВАНЬ ЗА РІВНЕМ ПРИБУТКОВОСТІ, %
Прибутковість активів Прибутковість капіталу
До 10 11 — 20
10 — 20 21 — 40
20 — 30 41 — 80
30 і більше 81 і більше

Перший та останній інтервали (або один із них) відкриті, тобто мають лише одну межу (верхню чи нижню). За допомогою відкритих інтервалів усі крайні значення ознаки, що варіює, зводяться в одну групу, завдяки чому групування стає компактним. Межі інтервалів визначаються по-різному. У першому варіанті групування верхня межа j- го інтервалу збігається з нижньою межею (j + 1)-го інтервалу. Правило віднесення межових значень ознаки до відповідного інтервалу задають слова, що стосуються відкритих інтервалів. Зокрема, слово «до» в першому інтервалі означає, що нижню межу слід уважати належною, а верхню — не належною інтервалу.

У другому варіанті групування верхня межа j- го інтервалу і нижня межа (j + 1)-го інтервалу різняться між собою. У цьому разі обидві межі вважаються такими, що належать інтервалу.

Інтервали типологічного групування формуються не за математичними принципами, а за соціально-економічним змістом. Межа інтервалу розглядається як умовна межа переходу кількості в нову якість. Число груп залежить від кількості існуючих типів. Наприклад, групуючи чоловіків за ознакою працездатності, застосовують вікові групи, років:

0—15 — особи допрацездатного віку;

16—59 — працездатного;

60 і більше — старші за працездатний вік.

Принцип рівних частот використовують нечасто і переважно в аналітичних групуваннях, щоб уникнути зважування групових середніх (дисперсійний аналіз результатів експерименту).

Групування за однією ознакою називається простим, за двома і більше ознаками — комбінаційним. У комбінаційних групуваннях ознаки ієрархічно впорядковуються за змістом чи за вагомістю.

Групи, утворені за першою ознакою, поділяються на підгрупи за другою, а ті, у свою чергу, можуть поділятися на підгрупи за третьою ознакою і т. д. На кожному етапі поділу використовується лише одна ознака, тобто відбувається послідовне описування груп. Кількість підгруп дорівнює добутку числа групувальних ознак на число градацій за кожною з них. У разі трьох і більше групувальних ознак сукупність стрімко подрібнюється, групи виявляються нечисленними, а характеристики груп — ненадійними.

Альтернативою комбінаційному групуванню є багатовимірне, коли групи утворюються за певною множиною ознак одночасно. Мірою подібності елементів є різні критерії і, як наслідок, — різні методи багатовимірного групування. Найпростішим серед них є групування за інтегральним показником, наприклад за рейтинговою оцінкою. У такому разі багатовимірне групування зводиться до простого.

Іноді доводиться перегруповувати дані, передусім щоб забезпечити порівнянність структур двох сукупностей за однією і тією самою ознакою. Результат перегрупування називають вторинним групуванням. Перегрупування виконують або об’єднанням, або розбиттям інтервалів первинного групування.

Якщо межі інтервалів первинного і вторинного групувань збігаються, частоти (частки) об’єднувальних інтервалів просто підсумовуються. Коли виконується розбиття інтервалу первинного групування, частоти поділяються між новоутвореними групами пропорційно до співвідношення частин довжини початкового інтервалу. Припускається, що всередині інтервалу поділ рівномірний.

Техніку перегрупування даних розглянемо на прикладі поділу працюючих за розміром середньомісячної заробітної плати у двох галузях промисловості (табл. 3.6).

Таблиця 3.6

ПОДІЛ ПРАЦЮЮЧИХ ЗА РІВНЕМ
СЕРЕДНЬОМІСЯЧНОЇ ЗАРОБІТНОЇ ПЛАТИ

Галузь А Галузь В
Заробітна плата, грн. Частка працюючих, % Заробітна плата, грн. Частка працюючих, %
До 160   До 160  
160 — 180   160 — 190  
180 — 200   190 — 220  
200 — 220   220 — 250  
220 — 240   250 — 280  
240 і більше   280 і більше  
Разом   Разом  

 

Результати первинного групування безпосередньо порівняти не можна, оскільки інтервали групування різні: у галузі А ширина інтервалу 20, у галузі В — 30 грн. Перегрупуємо дані, утворивши п’ять груп з інтервалом h = 40 грн. Очевидно, інтервали поділу в галузі А потрібно об’єднати, а в галузі В — розбити. Результати вторинного групування ілюструє табл. 3.7.

Таблиця 3.7

ВТОРИННЕ ГРУПУВАННЯ ПРАЦЮЮЧИХ
ЗА РІВНЕМ СЕРЕДНЬОМІСЯЧНОЇ ЗАРОБІТНОЇ ПЛАТИ

Заробітна плата, грн. Частка працюючих, %
Галузь А Галузь В
До 160    
  160 — 200   20 + 26 = 46
  200 — 240   23 + 9 = 32
  240 — 280  
280 і більше  
Разом    

 

Порівнявши частки вторинного групування, побачимо, що в галузі В сукупність працюючих за рівнем заробітної плати більш диференційована. Перегрупуванням даних можна перейти від структурного групування до типологічного.

 

Ряди розподілу

Після обробки кількісних значень, їх систематизації, ми дістаємо певний цифровий ряд, який називається статистичний ряд. Він має дві форми: ряд розподілу і динамічний ряд.

§ Ряд розподілу – це впорядкований розподіл сукупності на групи за певною варіюючою ознакою, розташованою в певному порядку (зростання, спадання тощо).

Виділяють атрибутивні і варіаційні ряди розподілу.

Ряд розподілу одиниць сукупності, в основу якого покладено якісні ознаки називається атрибутивним. Прикладом атрибутивного ряду розподілу може бути розподіл населення на міське і сільське.

 

Ряд розподілу одиниць сукупності за ознакою, що має кількісне вираження, називається варіаційним.

Варіаційний ряд розподілу має свої особливості. Він складається з двох елементів: варіантів і частот.

§ Варіантами називають числові значення розмірів кількісної ознаки. Числа, які відповідають цим варіантам, називаються частотами. Частоти можуть виражатися як в абсолютних, так і у відносних одиницях (напр. відсотках).

Відповідно до варіації ознаки, варіаційні ряди розподілу можуть бути дискретними і інтервальними. В дискретному ряді розподілу кількісна ознака приймає тільки цілі значення. Коли значення варіантів ряду виражено у вигляді інтервалу, такий ряд розподілу називається інтервальним.

 

 

Групи сімей - варіант Кількість сімей - частота Акумулятивна частка
     

§ Накопичення часток по мірі зростання (спадання) ознаки називається акумулятивна частка.

 

За характером розподілу варіаційні ряди можуть бути симетричні і асиметричні.

Ряд розподілу, де частоти спочатку наростають, а потім спадають, називається симетричним. Ряд розподілу, в якому частоти розташовані несиметрично від середини, називається асиметричним або скошеним.

Графічно ряди розподілу зображаються у вигляді гістограми або полігону (де ось OY – результативна ознака, ось OX – факторна ознака):

 


До характеристик варіації відносяться наступні показники: розмах варіації, середнє лінійне відхилення, середній квадрат відхилення, середнє квадратичне відхилення, коефіцієнти варіації.

Задача №1. Нехай маємо дві бригади із такою продуктивністю праці працівників:

1) 29, 31, 33, 30, 34;

2) 31, 32, 37, 27, 30.

Необхідно порівняти ці дві бригади.

Спочатку знайдемо середню продуктивну працю по кожній бригаді:

Розмах варіації становить різницю між мінімальним і максимальним значенням ознаки: R = xmax – xmin.

 

В нашому випадку:

R1 = 34 – 29 = 5

R2 = 37 – 27 = 10

 

 

Закономірність розподілу

 

Статистична сукупність формується під впливом причин та умов, з одного боку — типових, спільних для всіх елементів сукупності, а з іншого — випадкових, індивідуальних. Ці чинники взаємозв’язані, а їх спільна взаємодія визначає як індивідуальні значення ознак, так і розподіл останніх у межах сукупності. Характерні властивості структури статистичної сукупності відбиваються в рядах розподілу.

Ряд розподілу складається з двох елементів: варіант
значень групувальної ознаки xj та частот (часток) fj. Саме у співвідношенні варіант і частот виявляється закономірність розподілу.

Залежно від статистичної природи варіант ряди розподілу поділяються на атрибутивні та варіаційні. Частотними характеристиками будь-якого ряду є абсолютна чисельність j -ї групи — частота fj та відносна частота j -ї групи — частка dj. Очевидно, що , а , або 100%. Додатковою характеристикою варіаційних рядів є кумулятивна частота (частка), що являє собою результат послідовного об’єднання груп і підсумовування відповідних їм частот (часток). Кумулятивна частота (частка ) характеризує обсяг сукупності зі значеннями варіант, які не перевищують xj (табл. 5.1).

Варіаційний ряд може бути дискретним або інтервальним. Якщо варіаційний ряд інтервальний з нерівними інтервалами, то його частотні характеристики непорівнянні. Тоді, аналізуючи розподіл, використовують щільність частоти (частки) на одиницю інтервалу, тобто або .

Таблиця 5.1

ЧАСТОТНІ ХАРАКТЕРИСТИКИ РЯДІВ РОЗПОДІЛУ

Значення варіант хj Частоти fj Частки dj Кумулятивні
частоти частки
х 1 f 1 d 1 f 1 d 1
х 2 f 2 d 2 f 1 + f 2 d 1 + d 2
х 3 f 3 d 3 f 1 + f 2 + f 3 d 1 + d 2 + d 3
... ... ... ... ...
хm fm dm  
Разом   ´ ´

 

Як приклад розглянемо розподіл фірм регіону за рівнем фондоозброєності праці в розрахунку на одного працюючого (табл. 5.2). Згідно зі значеннями кумулятивних часток на більшості фірм (50,6%) фондоозброєність праці не перевищує 5 млн грн. Щільність розподілу зі зростанням ширини інтервалу зменшується.

 

Таблиця 5.2

РОЗПОДІЛ ФІРМ РЕГІОНУ ЗА РІВНЕМ ФОНДООЗБРОЄНОСТІ ПРАЦІ

Фондоозброєність праці, млн грн. Частка dj, % Кумулятивна частка Щільність частки gj, %
1 — 2 13,4 13,4 13,4
2 — 5 37,2 50,6 12,4
5 — 10 23,5 74,1 4,7
10 — 20 16,8 90,9 4,7
20 — 50 9,1 100,0 0,3
Разом   ´ ´

 

Кожний розподіл має характерні особливості. Найтиповіші з них подано в рядах розподілу (табл. 5.3). Групувальною ознакою є тарифний розряд, значення якого варіюють у межах від 2 до 6. Припустимо, що розподіли робітників умовних професій за рівнем кваліфікації різні. Так, у рядах А і В розподіл частот однаковий, але центри розподілу, навколо яких групуються індивідуальні значення, різні: в ряду А — 5-й розряд, в ряду В — 4-й. У рядах С, D, К центр розподілу такий самий, як і в ряду В, — 4-й, проте форма розподілу різна. Ряди В і С різняться межами варіації; у рядах С і D при однакових межах варіації і симетричному розподілі частот різний ступінь витягнутості вздовж осі ординат, різна крутизна розподілу: у розподілі С лише 36% обсягу сукупності групується навколо центра, у розподілі D — 76% обсягу. Розподіл К відрізняється від інших асиметричністю відносно центра.

Таблиця 5.3

РОЗПОДІЛ РОБІТНИКІВ ЗА РІВНЕМ КВАЛІФІКАЦІЇ

Тарифний розряд Професії
А В С D К
       
         
           
           
         
Разом          

 

Отже, поглиблений аналіз закономірностей розподілу передбачає характеристику зазначених особливостей сукупності, зокрема:

а) визначення типового рівня ознаки, який є центром тяжіння;

б) вимірювання варіації ознаки, ступеня згрупованості індивідуальних значень ознаки навколо центра розподілу;

в) оцінювання особливостей варіації, ступеня її відхилення від симетрії;

г) оцінювання нерівномірності розподілу значень ознаки між окремими елементами сукупності, тобто ступінь їх концентрації.

Базою аналізу закономірностей розподілу є варіаційний ряд — дискретний або інтервальний — з рівними інтервалами.

 

Характеристики центру розподілу

 

Центром тяжіння будь-якої статистичної сукупності є типовий рівень ознаки, узагальнююча характеристика всього розмаїття її індивідуальних значень. Такою характеристикою є середня величина . За даними ряду розподілу середня обчислюється як ариф­метична зважена; вагами є частоти fj або частки dj:

, ,

де j — номер групи; m — число груп.

В інтервальних рядах, припускаючи рівномірний розподіл елементів сукупності в межах j -го інтервалу, як варіанту використовують середину інтервалу. При цьому ширину відкритого інтервалу умовно вважають такою самою, як сусіднього закритого інтервалу.

Дані для розрахунку середнього рівня в інтервальному ряду розподілу наведено в табл. 5.4. Згідно з розрахунками, у середньо-
му на одного члена домогосподарства припадає = 1800: 200 =
= 9 м2 житлової площі. Це типовий рівень забезпеченості населення житлом.

Таблиця 5.4

РОЗПОДІЛ ДОМОГОСПОДАРСТВ МІСТА ЗА РІВНЕМ
ЗАБЕЗПЕЧЕНОСТІ ЖИТЛОМ

Житлова площа на одного члена домогосподарства, м2 Кількість домо- господарств fj xj xj fj Кумулятивна частка
До 5        
5 — 7        
7 — 9        
9 — 11        
11 — 13        
13 — 15        
15 і більше        
Разом   ´   ´

 

Окрім типового рівня важливе значення має домінанта, тобто найбільш поширене значення ознаки. Таке значення називають модою (Мо). У дискретному ряду моду визначають безпосередньо за найбільшою частотою (часткою). Наприклад, якщо депозитна ставка у восьми комерційних банків — 12% річних, а в двох — 10%, то модальною є ставка 12%.

В інтервальному ряду за тим самим принципом визначається модальний інтервал, а в разі потреби конкретне модальне значення в середині інтервалу обчислюється за інтерполяційною формулою

,

де та h — відповідно нижня межа та ширина модального інтервалу, , , — частоти (частки) відповідно модального, передмодального та післямодального інтервалів.

За даними табл. 5.4 модальним є інтервал 7 — 9, що має найбільшу частоту ; ширина модального інтервалу h = 2; нижня межа х 0 = 7; передмодальна частота = 39, післямодальна — = 42. За такого співвідношення частот модальне значення забезпеченості населення житлом:

= 8,1 м2.

Для моди як домінанти число відхилень (х – Мо) мінімальне. Оскільки мода не залежить від крайніх значень ознаки, то її до-
цільно використовувати тоді, коли ряд розподілу має невизначені межі.

Характеристикою центра розподілу вважається також медіана (Ме) — значення ознаки, яке припадає на середину впорядкованого ряду, поділяє його навпіл — на дві рівні за обсягом частини. Визначаючи медіану, використовують кумулятивні частоти або частки . У дискретному ряду медіаною буде значення ознаки, кумулятивна частота якого перевищує половину обсягу сукупності, тобто (для кумулятивної частки ).

В інтервальному ряду за цим принципом визначають медіанний інтервал, а значення медіани в середині інтервалу, як і значення моди, обчислюють за інтерполяційною формулою:

,

де x 0 та h — відповідно нижня межа та ширина медіанного інтервалу; f me — частота медіанного інтервалу; — кумулятивна частота передмедіанного інтервалу.

За даними табл. 5.4 половина обсягу сукупності припадає на інтервал 7 — 9 з частотою = 51; передмедіанна кумулятивна частота = 56. Отже, медіана забезпеченості населення житлом:

м2.

У симетричному розподілі всі три зазначені характеристики центра розподілу однакові: , у помірно асиметричному відстань медіани до середньої втричі менша за відстань середньої до моди, тобто . Саме таке співвідношення характеристик центра розподілу в розглянутому прикладі:

3 (9 – 8,7) = 9 – 8,1.

Медіана, як і мода, не залежить від крайніх значень ознаки; сума модулів відхилень варіант від медіани мінімальна, тобто вона має властивість лінійного мінімуму:

.

Цю властивість медіани можна використати при проектуванні розміщення зупинок міського транспорту, заготівельних пунктів тощо.

Окрім моди і медіани, в аналізі закономірностей розподілу використовуються також квартилі та децилі. Квартилі — це варіанти, які поділяють обсяги сукупності на чотири рівні частини, децилі — на десять рівних частин. Ці характеристики визначаються на основі кумулятивних частот (часток) за аналогією з медіаною, яка є другим квартилем або п’ятим децилем.

У ряду розподілу (див. табл. 5.4) перший квартиль становить 6,7 м2, перший дециль — 5,2 м2, дев’ятий — 13,3 м2:

;

;

.

Отже, у 25% сімей забезпеченість житлом не перевищує 6,7 м2, серед 10% малозабезпечених найвищий рівень становить 5,2 м2, а серед 10% найбільш забезпечених нижня межа — 13,3 м2.

 

 

Характеристики варіації

 

В одних сукупностях індивідуальні значення ознаки щільно групуються навколо центра розподілу, в інших — значно відхиляються. Чим менші відхилення, тим однорідніша сукупність, а отже, тим більш надійні й типові характеристики центра розподілу, передусім середня величина. Вимірювання ступеня коливання ознаки, її варіації — невід’ємна складова аналізу закономірностей розподілу. Міри варіації широко використовуються у практичній діяльності: для оцінювання диференціації домашніх господарств за рівнем доходу, фінансового ризику інвестування, ритмічності роботи підприємств, сталості врожайності сільськогосподарських культур тощо.

На основі характеристик варіації оцінюється інтенсивність структурних зрушень, щільність взаємозв’язків соціально-еконо­мічних явищ, точність результатів вибіркового обстеження.

Для вимірювання та оцінювання варіації використовуються абсолютні та відносні характеристики. До абсолютних належать: варіаційний розмах, середнє лінійне та середнє квадратичне відхилення, дисперсії; відносні характеристики подаються низкою коефіцієнтів варіації, локалізації, концентрації.

Варіаційний розмах R — це різниця між максимальним і мінімальним значеннями ознаки: R = x maxx min. Він характеризує діапазон варіації, наприклад родючості ґрунтів у регіоні, продуктив­ності праці в галузях промисловості тощо. Безперечною перевагою варіаційного розмаху як міри варіації є простота його обчислення й тлумачення.

Проте, коли частоти крайніх варіант надто малі, варіаційний розмах неадекватно характеризує варіацію. У таких випадках використовують квартильні або децильні розмахи. Квартильний розмах охоплює 50% обсягу сукупності, децильний — 60% або — 80%.

Інші абсолютні характеристики варіації враховують усі відхилення значень ознаки від центра розподілу, поданого середньою величиною. Оскільки алгебраїчна сума відхилень , то використовуються або модулі відхилень , або квадрати відхилень . Узагальнюючою характеристикою варіації є середнє відхилення:

а) лінійне

;

б) квадратичне, або стандартне

;

в) дисперсія (середній квадрат відхилень)

.

На підставі первинних, незгрупованих даних наведені характеристики обчислюють за принципом незваженої середньої:

або .

Середнє лінійне та середнє квадратичне відхилення є безпосередніми мірами варіації. Це іменовані числа (в одиницях вимірювання ознаки), за змістом вони ідентичні, проте завдяки математичним властивостям . Коли обсяг сукупності досить великий і розподіл ознаки, що варіює, наближається до нормального, то , а . Значення ознаки в межах мають 68,3% обсягу сукупності, у межах — 95,4%, у межах — 99,7%. Це відоме «правило трьох сигм». При значній асиметрії розподілу (див. підрозд. 5.4) розрахунок не має сенсу.

На основі взаємозв’язку між варіаційним розмахом R, середнім квадратичним відхиленням і чисельністю сукупності n Р. Пірсон обчислив коефіцієнти k, за допомогою яких орієнтовно можна визначити середнє квадратичне відхилення за варіаційним розмахом: . Значення коефіцієнтів k наведено в табл. 5.5.

 

Таблиця 5.5

КОЕФІЦІЄНТИ k ДЛЯ РІЗНОГО ОБСЯГУ СУКУПНОСТІ

n              
k 0,32 0,27 0,24 0,23 0,22 0,20 0,18

 

Очевидний взаємозв’язок середнього квадратичного відхилення та дисперсії: . Дисперсія входить до більшості теорем теорії ймовірностей, які є фундаментом математичної статистики, і широко використовується для вимірювання зв’язку й перевірки статистичних гіпотез. Види та властивості дисперсій розглядаються в підрозд. 5.5.

При порівнянні варіації різних ознак або однієї ознаки в різних сукупностях використовуються коефіцієнти варіації V. Вони визначаються відношенням абсолютних іменованих характеристик варіації (, , R) до центра розподілу, найчастіше виражаються у процентах. Значення цих коефіцієнтів залежить від того, яка саме абсолютна характеристика варіації використовується. Отже, маємо коефіцієнти варіації:

лінійний ;

квадратичний ;

осциляції .

Якщо центр розподілу поданий медіаною, то за відносну міру варіації беруть квартильний коефіцієнт варіації

.

Для оцінювання ступеня варіації застосовують також співвідношення децилів. Так, коефіцієнт децильної диференціації показує кратність співвідношення дев’ятого та першого децилів:

.

Необхідні для розрахунку узагальнюючих характеристик варіації величини подано в табл. 5.6 на прикладі розподілу домогосподарств за рівнем забезпеченості житлом. Середня розподілу становить 9 м2.

Таблиця 5.6

ДО РОЗРАХУНКУ УЗАГАЛЬНЮЮЧИХ ХАРАКТЕРИСТИК ВАРІАЦІЇ

xj fj
    –5      
    –3      
    –1      
           
           
           
           
Разом   ´   ´  

 

Згідно з розрахунками:

2,53 м2;

;

м2;

.

Децильний коефіцієнт VD = 13,3: 5,2 = 2,5 показує, що нижня межа 10% відносно забезпечених житлом домогосподарств в 2,5 раза перевищує верхню межу 10% малозабезпечених домогосподарств.

 

Характеристики форми розподілу

 

Аналіз закономірностей розподілу передбачає оцінювання ступеня однорідності сукупності, асиметрії та ексцесу розподілу.

Однорідність сукупності — передумова використання інших ста­тистичних методів (середніх величин, регресійного аналізу тощо). Однорідними вважаються такі сукупності, елементи яких мають спільні властивості і належать до одного типу, класу. При цьому однорідність означає не повну тотожність властивостей елементів, а лише наявність у них спільного в істотному, головному.

В однорідних сукупностях розподіли одновершинні (одномодальні). Багатовершинність свідчить про неоднорідний склад сукупності, про різнотиповість окремих складових. У такому разі необхідно перегрупувати дані, виокремити однорідні групи. Критерієм однорідності сукупності вважається квадратичний коефіцієнт варіації, який завдяки властивостям в симетричному розподілі становить . Згідно з цим критерієм сукупність домогосподарств за рівнем забезпеченості житлом практично однорідна ().

З-поміж одновершинних розподілів є симетричні та асиметричні (скошені), гостро- та плосковершинні. У симетричному розподілі рівновіддалені від центра значення ознаки мають однакові частоти, в асиметричному — вершина розподілу зміщена. Напрям асиметрії протилежний напряму зміщення вершини. Якщо вершина зміщена ліворуч, маємо правосторонню асиметрію, і навпаки. Зазначимо, що асиметрія виникає внаслідок обмеженої варіації в одному напрямі або під впливом домінуючої причини розвитку, яка призводить до зміщення центра розподілу. Ступінь асиметрії різний — від помірного до значного.

Як уже зазначалося, у симетричному розподілі характеристики центра — середня, мода, медіана — мають однакові значення, в асиметричному між ними існують певні розбіжності. У разі правосторонньої асиметрії , а в разі лівосторонньої, навпаки, . Чим більша асиметрія, тим більше відхилення (





Поделиться с друзьями:


Дата добавления: 2016-12-06; Мы поможем в написании ваших работ!; просмотров: 1101 | Нарушение авторских прав


Поиск на сайте:

Лучшие изречения:

Логика может привести Вас от пункта А к пункту Б, а воображение — куда угодно © Альберт Эйнштейн
==> читать все изречения...

2225 - | 2154 -


© 2015-2024 lektsii.org - Контакты - Последнее добавление

Ген: 0.015 с.