Кореляційно-регресійний аналіз: області застосування, основні етапи

Кореляційно-регресійний аналіз: області застосування, основні етапи

Поняття кореляційно-регресійного аналізу передбачає проведення низки операцій, а саме: визначення тісноти зв 'язку, її напряму та встановлення рівняння, що описує форму зв' язку. Цей вид аналізу містить дві окремі складові: кореляційний і регресійний аналіз.

Значення та основні етапи процесу кореляційно-регресійного аналізу економічних явищ

Кореляційно-регресійний аналіз - це один із способів вирішення завдань і пошуку інформації. Він дозволяє визначити спільний вплив безлічі взаємопов 'язаних і одноразово діючих ознак, а також окремий вплив кожної ознаки на економічне явище (процес). Завдяки цьому типу аналізу можна оцінити ступінь взаємозв 'язку між кількома ознаками, між ознаками і отриманим результатом, а також змоделювати рівняння регресії, що описують форму взаємозв' язку.

Етапи аналізу

Кореляційно-регресійний аналіз економічних процесів поділяється на кілька етапів:

  1. Визначення аргументів і попередня обробка умовної інформації.
  2. Визначення тісноти та форми взаємозв 'язку між кількома ознаками.
  3. Моделювання представленого економічного процесу та аналіз отриманої моделі.
  4. Застосування кінцевих результатів для удосконалення планування та менеджменту моделі.

Статистичну однорідність інформації можна визначити за допомогою двох прийомів. Для початку необхідно визначити і відкинути значення факторів, що різко відрізняються від усіх величин. Потім здійснюється статистичне дослідження однорідності за допомогою перевірки незалежності вибірки та її належності до єдиної сукупності з нормальним розподілом.

Модель регресії визначається через метод найменших квадратів, завдяки якому забезпечується найкраще наближення оцінки результату, визначеного через рівняння регресії, до його факторів.

Кореляційно-регресійний аналіз: параметри створеної моделі

Найголовнішими факторами, що визначають характеристики моделі, прийнято вважати:

  • Коефіцієнти парної кореляції (демонструють силу взаємозв 'язку двох факторів).
  • Коефіцієнт множинної кореляції (визначає взаємозв 'язок результату і факторів).
  • Коефіцієнти приватної детермінації (показують вплив варіації аргументу на варіацію шуканої ознаки).
  • Коефіцієнт множинної детермінації (показує питому вагу всіх аргументів на варіацію шуканої ознаки).
  • Приватні коефіцієнти еластичності (характеризують вплив факторів на результат, виражений в єдиному масштабі у відсотках).

Мета аналізу

Основні завдання кореляційно-регресійного аналізу - це виявлення факторів, що істотно впливають на економічний результат явища або процесу, і використання отриманої інформації для удосконалення планування економічного процесу або явища.

Параметричні методи аналізу

Всі виробничі процеси знаходяться в тісному взаємозв 'язку. Цей взаємозв 'язок буває стохастичним (результат залежить від безлічі факторів) і функціональним (результат змінюватися на таку ж величину, як і фактор). Стохастична залежність найчастіше має кореляційний характер, тобто значенню фактора одночасно відповідає кілька значень результату, що мають абсолютно різні напрямки.

Кореляційна решітка

Кореляційний взаємозв 'язок може мати один або декілька факторів-ознак, мати позитивну або негативну спрямованість, бути прямолінійною або криволінійною (залежно від виразу). Визначити, до якого саме типу відноситься зв 'язок, можна за допомогою кореляційної решітки. Її будують у межах прямокутних осей координат.

Частоти, розміщені близько до діагоналів, свідчать про високий взаємозв 'язок ознак. Частоти, розміщені близько до діагоналі, що проходить через лівий нижній і правий верхній кути, говорять про позитивний напрямок, а проходять через верхній лівий і правий нижній кут - про протилежний напрямок. Частоти, розташовані у формі дуги, свідчать про криволінійний взаємозв 'язок, а безладно розкидані - про відсутність взаємозв' язку взагалі.

Основний метод кореляційного аналізу - це лінійний коефіцієнт кореляції. Він може приймати значення від -1 до + 1. Чим ближче значення до 1, тим сильніше зв 'язок між фактором і результатом. Додатні значення говорять про прямий взаємозв 'язок, а від' ємні - про зворотній. Коефіцієнт приймає значення "" нуль "" у тому випадку, якщо між ознаками відсутній взаємозв 'язок.

Непараметричні методи аналізу

Ряд методів дозволяє оцінити взаємозв 'язок явищ без кількісного виразу ознаки і, відповідно, параметрів розподілу. Їх називають непараметричними. Серед них виділяють:

  • Коефіцієнт рангової кореляції Кендалла (визначає взаємозв 'язок кількісних і якісних значень показників, у разі якщо вони підлягають ранжуванню).
  • Коефіцієнт рангової кореляції Спирмена (присвоює ранги кожному аргументу і результату, на основі яких визначаються різниці і обчислюється показник).
  • Коефіцієнт кореляції знаків Фехнера (визначає кількість збігів і неспівпадінь відхилень аргументів і результатів від їх середнього значення).
  • Ще один важливий метод кореляційно-регресійного аналізу - Метод найменших квадратів, що дозволяє визначити аналітичний вираз взаємозв 'язку результативної ознаки і його фактора. Він полягає в побудові системи рівнянь і визначенні параметрів цих рівнянь.

Кореляційно-регресійний аналіз: приклад

У статистиці та економіці застосовуються найрізноманітніші види та об 'єкти аналізу. Статистичні методи аналізу спрямовані на вивчення процесів, що повторюються, для того щоб скласти тривалі прогнози поведінки економічних явищ.

Наприклад, для того щоб проаналізувати соціально-економічний розвиток території, необхідно вивчити показники рівня життя населення. Кореляційно-регресійний аналіз у статистиці дозволяє створити рівняння регресії і визначити коефіцієнти кореляції, що демонструють взаємозв 'язок між рівнем життя і розвитком території. Рівень життя визначається доходами, а основне джерело доходів - зарплата. У такому випадку фактором виступає рівень зарплати, а результатом - чисельність населення з невисокими доходами.

Програмне забезпечення аналізу

Для полегшення розрахунків можна проводити кореляційний аналіз в Excel. У цій програмі існує ряд інструментів, що допомагають полегшити розрахунки. Серед них функція "Кореляція", що дозволяє сформувати матрицю з коефіцієнтів і різних параметрів. Вона зображується у формі таблиці. Як стовпчики та рядки використовуються кореляційні коефіцієнти. На основі отриманих даних таблиці необхідно буде провести кореляційний аналіз. Приклад послідовності проведення аналізу:

  1. У команді "Сервіс" вибрати "Аналіз даних".
  2. Як інструмент аналізу виберіть "Кореляція".
  3. У вікні, що з 'явилося в рядку "Вхідний інтервал", вказати діапазон аналізованих даних, вибрати "Угруповання" в рядку "Параметри виводу", ввести діапазон виводу результатів і натиснути "OK".

У результаті вийде кореляційна матриця, розташована в діапазоні виведення. Всередині буде вказано коефіцієнт лінійної кореляції, що оцінює тісноту і форму зв 'язку між показниками.

Проведення аналізу в Excel

У MS Excel використовується функція "Кореляція" для того, щоб провести кореляційно-регресійний аналіз. Приклад розрахунку коефіцієнтів розглянемо далі. Ця функція формує матрицю з коефіцієнтами тісноти взаємозв 'язку між різними параметрами. У результаті формується квадратна таблиця, що містить коефіцієнти кореляції на перетині рядків і стовпчиків.

Для проведення аналізу необхідно буде виконати ряд певних дій:

  1. Відкрити команду "Інструменти", а в ній "Аналіз даних".
  2. У вікні, що з 'явилося, вказати в переліку "Інструменти аналізу" пункт "Кореляція".
  3. У вікні "Кореляція", що розкривається, вказати вхідний інтервал у вигляді діапазону комірок, що містить інформацію, що аналізується (він повинен бути не менше двох стовпчиків), поставити галочку в пункті "Угруповання", а в полі "Параметри виводу" вибрати верхню ліву комірку, де починається кореляційна матриця.
  4. Натиснути кнопку Гаразд.

У результаті обчислення з 'явиться квадратна таблиця з коефіцієнтами кореляції.

Регресійний аналіз у MS Excel

Для обчислення рівняння лінійної регресії, що описують взаємозв 'язок між факторами і результатом, в MS Excel застосовується статистична функція "Лінейн". Для того щоб її використовувати, необхідно:

  1. Виділити порожню область, до якої будуть виведені результати аналізу.
  2. Відкрити "Майстер функцій", у ньому знайти категорію "Статистичні", а в ній функцію "Лінейн" і натиснути OK.
  3. У полі "Відомі значення у" введіть діапазон аналізованих результатів, у полі "Відомі значення х" - діапазон аналізованих факторів.
  4. У полі "Константа" вказується присутність вільного члена рівняння (1 - так, 0 - ні), а в полі "Статистика" - необхідність виводу додаткових відомостей (1 - з 'явиться додаткова інформація, 0 - з' являться тільки оцінки параметрів). За замовчуванням можна вказувати в обох полях 1.
  5. Натиснути кнопку Гаразд.

Вгорі раніше виділеної області з 'явиться початковий елемент таблиці. Щоб розкрити всі дані, необхідно натиснути F2, а потім одночасно комбінацію клавіш Ctrl + Shift + Enter.

У підсумку регресійна інформація буде зображуватися як таблиця з двох стовпчиків і п 'яти рядків:

 

Стовпчик 1

Стовпчик 2

Рядок 1

Коефіцієнт b

Коефіцієнт a

Рядок 2

Середньоквадратичне відхилення b

Середньоквадратичне відхилення a

Рядок 3

Коефіцієнт детермінації

Середньоквадратичне відхилення y

Рядок 4

F-статистика

Кількість ступенів свободи

Рядок 5

Регресійна сума квадратів

Залишкова сума квадратів

Отримані результати необхідно підставити в лінійне рівняння регресії, яке виглядає наступним чином: y = a + bx. В якості коефіцієнта a підставляється значення з комірки на перетині рядка 1 і стовпчика 2. Як коефіцієнт b - значення на перетин рядка 1 і стовпчика 1.

Коефіцієнт детермінації говорить про те, яка частина результату пояснюється за допомогою досліджуваного фактора. Решта результатів визначається факторами, неврахованими в лінійній моделі.