Analiza korelacji i regresji: zastosowanie, główne etapy

24.03.2019

Koncepcja analizy korelacyjno-regresyjnej implikuje szereg operacji, a mianowicie określenie bliskości relacji, jej kierunku i ustanowienia równania opisującego formę związku. Ten rodzaj analizy zawiera dwa oddzielne komponenty: analizę korelacji i regresji.

Wartość i główne etapy procesu analizy korelacji i regresji zjawisk gospodarczych

Analiza korelacji i regresji jest jednym ze sposobów rozwiązywania problemów i wyszukiwania informacji. Pozwala określić wspólny wpływ wielu powiązanych ze sobą i jednocześnie działających znaków, a także odrębny wpływ każdego atrybutu na zjawisko (proces) ekonomiczne. Dzięki temu rodzajowi analizy możliwe jest oszacowanie stopnia zależności między kilkoma cechami, między charakterystykami i uzyskanym wynikiem, a także modelowanie równania regresji opisującego formę wzajemnych zależności. analiza regresji korelacji

Etapy analizy

Analiza korelacji i regresji procesów gospodarczych dzieli się na kilka etapów:

  1. Definicja argumentów i wstępne przetwarzanie informacji warunkowych.
  2. Definicja bliskości i formy wzajemnego powiązania wielu znaków.
  3. Modelowanie przedstawionego procesu gospodarczego i analiza modelu wynikowego.
  4. Zastosowanie końcowych wyników w celu usprawnienia planowania i zarządzania modelem.

Jednorodność informacji statystycznych można określić za pomocą dwóch technik. Na początek należy określić i odrzucić wartość czynników, które różnią się znacznie od wszystkich wielkości. Następnie dokonuje się statystycznego badania jednorodności, sprawdzając niezależność próbki i jej przynależność do pojedynczego zestawu o rozkładzie normalnym. Przykład analizy regresji korelacji

Model regresji wyznacza się metodą najmniejszych kwadratów, która zapewnia najlepsze przybliżenie szacowanego wyniku, określonego równaniem regresji, do jego współczynników.

Analiza korelacji i regresji: parametry stworzonego modelu

Za najważniejsze czynniki określające charakterystykę modelu uważa się:

  • Współczynniki korelacji par (wykazać siłę związku dwóch czynników).
  • Współczynnik korelacji wielokrotnej (określa zależność wyniku i czynników).
  • Współczynniki prywatnego określania (pokazują wpływ zmienności argumentu na zmienność pożądanej cechy).
  • Współczynnik wielokrotnego określania (pokazuje proporcję wszystkich argumentów na temat zmiany pożądanej charakterystyki).
  • Prywatne współczynniki elastyczności (scharakteryzuj wpływ czynników na wynik, wyrażony w pojedynczej skali w procentach).

Metoda analizy regresji korelacji

Cel analizy

Głównymi zadaniami analizy korelacji-regresji są identyfikacja czynników, które znacząco wpływają na wynik ekonomiczny zjawiska lub procesu, oraz wykorzystanie uzyskanych informacji w celu usprawnienia planowania procesu lub zjawiska gospodarczego.

Metody analizy parametrycznej

Wszystkie procesy produkcyjne są ze sobą ściśle powiązane. Ta zależność jest stochastyczna (wynik zależy od wielu czynników) i funkcjonalna (wynik zmienia się o tę samą wartość co czynnik). Zależność stochastyczna ma często charakter korelacyjny, tzn. Wartość współczynnika odpowiada jednocześnie kilku wartościom wyniku, mając zupełnie różne kierunki.

analiza regresji korelacji problemowej

Siatka korelacji

Relacja korelacji może mieć jeden lub kilka znaków czynników, mieć kierunek dodatni lub ujemny, być prosta lub krzywoliniowa (w zależności od wyrażenia). Możliwe jest określenie, który typ relacji jest powiązany przy użyciu siatki korelacji. Jest zbudowany w prostokątnych osiach współrzędnych.

Częstotliwości umieszczone blisko przekątnych wskazują na wysoką korelację znaków. Częstotliwości umieszczone blisko przekątnej przechodzącej przez dolne lewe i prawe górne rogi wskazują kierunek dodatni, podczas gdy te przechodzące przez górny lewy i prawy dolny róg wskazują przeciwny kierunek. Częstotliwości znajdujące się w kształcie łuku wskazują na krzywoliniowy związek i są losowo rozproszone - o braku związku w ogóle.

Podstawowa metoda analizy korelacji jest liniowa. współczynnik korelacji. Może przyjmować wartości od -1 do +1. Im wartość zbliżona jest do 1, tym silniejszy związek między czynnikiem a wynikiem. Wartości dodatnie wskazują na bezpośredni związek, a wartości ujemne wskazują na odwrotność. Współczynnik przyjmuje wartość "zero", jeśli nie ma związku między znakami.

analiza regresji korelacji w statystykach

Nieparametryczne metody analizy

Wiele metod pozwala na ocenę związku zjawisk bez ilościowej ekspresji cechy i odpowiednio parametrów rozkładu. Nazywa się je nieparametrycznymi. Wśród nich są:

  • Współczynnik korelacji rang Kendalla (określa stosunek ilościowych i jakościowych wartości wskaźników, jeśli podlegają one rankingowi).
  • Współczynnik korelacji rang Spearmana (przypisuje rangi każdemu argumentowi i wynikowi, na podstawie którego ustalane są różnice i obliczany jest wskaźnik).
  • Współczynnik korelacji znaków Fechnera (określa liczbę zbiegów okoliczności i niedopasowanie między odchyleniami argumentów a wynikami od ich wartości średniej).
  • Inną ważną metodą analizy korelacji i regresji jest metoda najmniejszych kwadratów, która pozwala określić analityczną ekspresję zależności uzyskanej cechy od jej czynnika. Polega na zbudowaniu układu równań i wyznaczeniu parametrów tych równań.

pojęcie analizy regresji korelacji

Analiza korelacji i regresji: przykład

Szeroka gama typów i obiektów analizy jest wykorzystywana w statystykach i ekonomii. Statystyczne metody analizy mają na celu badanie powtarzających się procesów w celu długoterminowych przewidywań zachowań zjawisk ekonomicznych.

Na przykład, aby przeanalizować rozwój społeczno-gospodarczy danego terytorium, konieczne jest zbadanie wskaźników dotyczących poziomu życia ludności. Analiza korelacji i regresji w statystykach umożliwia tworzenie równanie regresji i określić współczynniki korelacji, które pokazują związek między poziomem życia i rozwojem terytorium. Poziom życia zależy od dochodu, a głównym źródłem dochodów jest wynagrodzenie. W tym przypadku czynnikiem jest poziom płac, a wynikiem jest populacja o niskich dochodach.

Oprogramowanie analityczne

Aby ułatwić obliczenia, możesz przeprowadzić analizę korelacji w Excelu. W tym programie dostępnych jest wiele narzędzi ułatwiających obliczenia. Wśród nich funkcja "Korelacja", która pozwala na utworzenie macierzy współczynników i różnych parametrów. Jest przedstawiona w formie stołu. Współczynniki korelacji są używane jako kolumny i wiersze. Na podstawie danych uzyskanych w tabeli konieczne będzie przeprowadzenie analizy korelacji. Przykład sekwencji analiz:

  1. W poleceniu "Usługa" wybierz "Analiza danych".
  2. Jako narzędzie do analizy wybierz pozycję "Korelacja".
  3. W wyświetlonym oknie, w linii "Interwał wejściowy", określ zakres analizowanych danych, wybierz element "Grupowanie" w wierszu "Parametry wyjściowe", wprowadź zakres wyjściowy wyników i kliknij "OK".

Wynikiem jest macierz korelacji zlokalizowana w zakresie wyjściowym. Wewnątrz zostanie wskazany liniowy współczynnik korelacji, oceniający szczelność i formę zależności między wskaźnikami.

metoda analizy korelacji

Analiza w Excelu

W MS Excel funkcja "Korelacja" służy do przeprowadzania analizy korelacji i regresji. Przykład obliczenia współczynników zostanie rozpatrzony później. Ta funkcja tworzy macierz ze współczynnikami bliskości relacji między różnymi parametrami. W wyniku tego powstaje tabela kwadratowa zawierająca współczynniki korelacji na przecięciu wierszy i kolumn.

Aby analiza wymagała wykonania szeregu konkretnych działań:

  1. Otwórz komendę "Usługa", a następnie element "Analiza danych".
  2. W wyświetlonym oknie określ pozycję "Korelacja" na liście "Narzędzia analityczne".
  3. W oknie "Korelacja", które zostanie otwarte, określ interwał wejściowy jako zakres komórek zawierających analizowane informacje (powinny to być co najmniej dwie kolumny), zaznacz opcję "Grupowanie", aw polu Parametry wyjściowe wybierz górną lewą komórkę, gdzie macierz korelacji.
  4. Kliknij przycisk OK.

W wyniku obliczeń pojawi się kwadratowa tabela ze współczynnikami korelacji.

Analiza regresji w MS Excel

Aby obliczyć równanie liniowe Regresje opisujące związek między czynnikami a wynikiem, w MS Excel, funkcja statystyczna "Linean" jest używana. Aby z niego skorzystać, musisz:

  1. Wybierz pusty obszar, w którym będą wyświetlane wyniki analizy.
  2. Otwórz "Master of Functions", w nim znajdź kategorię "Statistical", a w niej funkcję "Lineine" i kliknij OK.
  3. W polu "Znane wartości y " wprowadzić zakres analizowanych wyników w polu "Znane wartości x" - zakres analizowanych czynników.
  4. Pole "Stała" wskazuje na obecność wolnego terminu w równaniu (1 - tak, 0 - nie), aw polu "Statystyka" - konieczność wyświetlenia dodatkowych informacji (1 - pojawią się dodatkowe informacje, pojawią się tylko 0 - oszacowania parametrów). Domyślnie można określić w obu polach 1.
  5. Kliknij OK.

U góry wcześniej wybranego obszaru pojawi się początkowy element tabeli. Aby wyświetlić wszystkie dane, musisz nacisnąć klawisz F2, a następnie jednocześnie kombinację klawiszy Ctrl + Shift + Enter.

W rezultacie informacja o regresji zostanie wyświetlona jako tabela złożona z dwóch kolumn i pięciu wierszy:

Kolumna 1

Kolumna 2

Linia 1

Współczynnik b

Współczynnik a

Linia 2

Odchylenie standardowe b

Odchylenie standardowe a

Linia 3

Współczynnik determinacji

Odchylenie standardowe y

Linia 4

Statystyka F

Liczba stopni swobody

Linia 5

Regresja sum kwadratów

Pozostała suma kwadratów

Wyniki należy zastąpić równaniem regresji liniowej, które wygląda następująco: y = a + bx. Wartość z komórki na przecięciu wiersza 1 i kolumny 2 zastępuje współczynnik a. Wartość współczynnika b na przecięciu wiersza 1 i kolumny 1.

Współczynnik determinacji wskazuje, jaka część wyniku jest wyjaśniona za pomocą badanego czynnika. Pozostała część wyników jest określana przez czynniki, których nie uwzględniono w modelu liniowym.