Вивченню взаємозв'язків між явищами та процесами, основному завданню статистики, слід приділити дуже велику увагу. Соціально-економічні явища – це результат одночасного впливу великої кількості причин. Визначальна мета вимірювання взаємозв’язків — виявити і дати кількісну характеристику причинних зв’язків. Вивчаючи закономірності зв’язку, причини та умови об’єднують в одне поняття «фактор». Відповідно ознаки, які характеризують фактори, називаються факторними, а ті, що характеризують наслідки, — результативними.
Зв’язки між явищами та їх ознаками класифікуються за ступенем тісноти (кількісні критерії оцінки щільності зв’язку), за напрямком (прямий та обернений зв'язок) та аналітичним виразом (лінійний або нелінійний). У статистиці вирізняють функціональні і стохастичні зв’язки. Частковим випадком стохастичного зв’язку є кореляційний зв'язок, при якому зміна середнього значення результативної ознаки обумовлена зміною факторних ознак.
Для виявлення наявності зв’язку, його характеру і напрямку в статистиці використовуються наступні методи: співставлення паралельних даних, аналітичні групування, графічний метод, кореляція і регресія.
Зв'язок між двома ознаками (результативною і факторною) характеризує парна регресія. Аналітично зв'язок описується рівняннями прямої, параболи або гіперболи. Зв'язок між трьома ознаками і більше має назву багатофакторної регресії. Важливою характеристикою кореляційного зв’язку є лінія регресії — емпірична в моделі аналітичного групування і теоретична в моделі регресійного аналізу. Емпірична лінія регресії представлена груповими середніми результативної ознаки , кожна з яких належить до відповідного інтервалу значень групувального фактора хj. Теоретична лінія регресії описується певною функцією яку називають рівнянням регресії, а Y — теоретичним рівнем результативної ознаки.
Поряд із визначенням характеру зв’язку та ефектів впливу факторів х на результат у важливе значення має оцінка щільності зв’язку, тобто оцінка узгодженості варіації взаємозв’язаних ознак. Серед мір щільності зв’язку найпоширенішим є коефіцієнт кореляції Пірсона. Відношення факторної дисперсії до загальної розглядається як міра щільності кореляційного зв’язку і називається коефіцієнтом детермінації: Корінь квадратний з коефіцієнта детермінації називають індексом кореляції R.
Таким чином, кореляційно-регресійний аналіз проводиться у такій послідовності: вибір форми регресії, визначення параметрів рівняння, оцінка тісноти зв'язку, перевірка істотності зв'язку.
Важливо знати, що в аналізі соціально-економічних явищ часто використовують умовні оцінки за допомогою рангів. Рангами називають числа натурального ряду, які згідно зі значеннями ознаки надаються елементам сукупності і певним чином упорядковують її. Взаємозв’язок між ознаками, які можна ранжувати, передусім на основі бальних оцінок, вимірюється методами рангової кореляції. Тут можуть використовуватисякоефіцієнт кореляції знаків Фенхера, коефіцієнт кореляції рангів Спірмена і Кендала. Для визначення щільності зв’язку між довільною кількістю ранжованих ознак використовується множинний коефіцієнт рангової кореляції (коефіцієнт конкордації). За допомогою цих коефіцієнтів можна вимірювати та оцінювати зв’язки як між кількісними, так і між атрибутивними ознаками. Взаємозв’язки між атрибутивними ознаками також аналізуються на підставі таблиць взаємної спряженості (співзалежності).