Skrˇt wyk-adu Ekonometria WSEI.doc

(508 KB) Pobierz
Spis treści

Wybrane zagadnienia z Ekonometrii WSEI

 

1. Dobór zmiennych objaśniających do modelu liniowego

 

1.1. Uwagi wstępne

             

              Zmienne objaśniające w modelu ekonometrycznym powinny się odznaczać następującymi własnościami:

Mieć odpowiednio wysoką zmienność;

Być silnie skorelowane ze zmienną objaśnianą;

Być silnie skorelowane ze zmienną objaśnianą;

Być słabo skorelowane między sobą;

Być silnie skorelowane z innymi zmiennymi nie pełniącymi roli zmiennych objaśniających, które zmienne objaśniające reprezentują (chodzi, by zmienne objaśniające były dobrymi reprezentantkami zmiennych, które nie weszły do zbioru zmiennych objaśniających).

Wybór zmiennych objaśniających do modelu ekonometrycznego odbywa się za pomocą metod statystycznych.

 

Procedura doboru jest następująca:

Na podstawie wiedzy merytorycznej sporządza się zestaw tzw. potencjalnych zmiennych objaśniających (zmiennych pierwotnych), którymi są wszystkie najważniejsze wielkości oddziałujące na zmienną objaśnianą. Zmienne te oznacza się jako X1, X2,...,Xm.

Gromadzi się dane statystyczne będące realizacjami zmiennej objaśnianej i potencjalnych zmiennych objaśniających. Otrzymuje się w ten sposób wektor y obserwacji zmiennej Y oraz macierz X obserwacji zmiennych X1, X2,...,Xm. o postaci:

,     

 

Eliminuje się potencjalne zmienne odznaczające się zbyt niskim poziomem zmienności.

Oblicza się współczynniki korelacji pomiędzy wszystkimi rozpatrywanymi zmiennymi.

Przeprowadza się redukcję zbioru potencjalnych zmiennych objaśniających za pomocą wybranej metody statystycznej.

 

1.2. Eliminowanie zmiennych quasi-stałych

             

              Wstępnym warunkiem uznania różnych zmiennych za zmienne objaśniające modelu jest ich dostatecznie wysoka zmienność. Miarą poziomu zmienności jest współczynnik zmienności:

,

gdzie - średnia arytmetyczna zmiennej Xi: , natomiast Si – odchylenie standardowe zmiennej Xi: . Obiera się krytyczną wartość współczynnika zmienności v*, np., v*=0,10; następnie zmienne spełniające nierówność vi£v* uznaje się za quasi-stałe i eliminuje ze zbioru potencjalnych zmiennych objaśniających, gdyż zmienne te nie wnoszą istotnych informacji do modelu ekonometrycznego.

 

1.3. Wektor i macierz współczynników korelacji

             

              Aby ocenić siłę liniowej zależności zmiennej objaśnianej Y i potencjalnych zmiennych objaśniających X1, X2, ..., Xm., oblicza się współczynnik korelacji:

Współczynniki te są przedstawiane w postaci wektora korelacji:.

Współczynnik korelacji między potencjalnymi zmiennymi objaśniającymi X1, X2, ..., Xm. są obliczane według wzoru:

Współczynniki te tworzą macierz korelacji: .

Macierz R jest symetryczna tzn. rij=rji.

 

1.5. Metoda wskaźników pojemności informacyjnej

 

Idea metody wskaźników pojemności informacyjnej sprowadza się do wyboru takich zmiennych objaśniających, które są silnie skorelowane ze zmienną objaśnianą, a jednocześnie słabo skorelowane ze sobą. Punktem wyjścia tej metody jest wektor R0 i macierz R.

Rozpatruje się wszystkie kombinacje potencjalnych zmiennych objaśniających, których ogólna liczba wynosi: L=2m-1. Dla każdej kombinacji zmiennych objaśniających oblicza się wskaźniki pojemności informacyjnej: indywidualne i integralne.

Indywidualne wskaźniki pojemności informacyjnej zmiennych w ramach rozpatrywanej kombinacji obliczane są następująco:

We wzorze tym l oznacza numer kombinacji, j oznacza numer zmiennej w kombinacji, natomiast ml oznacza liczbę zmiennych w rozpatrywanej kombinacji.

Integralne wskaźniki pojemności informacyjnej kombinacji potencjalnych zmiennych objaśniających obliczane są według następującego wzoru:

Indywidualne oraz integralne wskaźniki pojemności informacyjnej są unormowane w przedziale [0;1]. Przyjmują one tym większe wartości, im zmienne objaśniające są silniej skorelowane ze zmienną objaśnianą oraz im słabiej są skorelowane miedzy sobą.

Jako zmienne objaśniające wybiera się taką kombinację zmiennych, której odpowiada maksymalna wartość wskaźnika integralnej pojemności informacyjnej.

 

1.6. Współczynnik korelacji wielorakiej

 

Współczynnik korelacji wielorakiej jest miarą siły związku liniowego zmiennej objaśnianej Y ze zmiennymi objaśniającymi X1, X2,..., Xk. Zdefiniowany jest następująco:

gdzie: det(R) – wyznacznik macierzy R współczynników korelacji zmiennych objaśniających X1, X2,..., Xk łączonych parami; det(W) – wyznacznik macierzy:

Wektor R0 jest wektorem współczynników korelacji między zmienną Y i zmiennymi X1, X2,..., Xk. Macierz W w rozwiniętej postaci przedstawia się następująco:

 

Współczynnik korelacji wielorakiej jest unormowany w przedziale [0, 1]. Przyjmuje tym większe wartości, im związek zmiennej objaśnianej ze zmiennymi objaśniającymi jest silniejszy. Współczynnik korelacji wielorakiej może stanowić kryterium wyboru najlepszej kombinacji zmiennych objaśniających spośród jednakowo licznych kombinacji.

 

 

2. Szacowanie parametrów modeli liniowych metodą najmniejszych kwadratów

 

2.1.Uwagi wstępne

 

Szacowanie parametrów modelu ekonometrycznego sprowadza się do przypisywania nieokreślonym liczbowo parametrom konkretnych wartości liczbowych. Szacowanie to powinno być przeprowadzone w taki sposób, aby zapewniło najlepsze dopasowanie modelu do danych empirycznych. Powszechnie wykorzystywaną metodą szacowania parametrów liniowych modeli ekonometrycznych o postaci:

jest klasyczna metoda najmniejszych kwadratów. Idea metody sprowadza się do takiego wyznaczenia wartości ocen a0, a1,..., ak parametrów strukturalnych α0, α1,..., αk, aby suma kwadratów odchyleń zaobserwowanych wartości zmiennej objaśnianej od jej wartości teoretycznych obliczonych z modelu była najmniejsza. Warunek ten zapisuje się następująco:

gdzie et (t=1, 2, ..., n) – odchylenie empirycznych wartości zmiennej objaśnianej od jej wartości teoretycznych, nazywane resztami modelu:

, (t=1, 2, ..., n)

przy czym: .

Zastosowanie metody najmniejszych kwadratów wymaga przyjęcia następujących założeń:

Szacowany model jest modelem liniowym;

Zmienne objaśniające są wielkościami nielosowymi o elementach ustalonych;

Nie występuje zjawisko współliniowości zmiennych objaśniających;

Składnik losowy ma wartość oczekiwaną równą zeru i stałą skończoną wariancję;

Nie występuje zjawisko autokorelacji składnika losowego, czyli zależność składnika losowego w różnych jednostkach czasu.

 

2.2. Szacowanie parametrów modelu z jedną zmienną objaśniającą

 

Liniowy model ekonometryczny z jedną zmienną ma ogólną postać:

Wartość ocen a oraz b parametrów strukturalnych α oraz β otrzymuje siκ w tym wypadku z warunku:

Po wyznaczeniu pochodnych cząstkowych funkcji S względem a oraz b i przyrównaniu ich do zera otrzymujemy tzw. układ równań normalnych:

W wyniku rozwiązania układu równań normalnych otrzymujemy następujące wzory na oceny a oraz b:

gdzie oraz oznaczają średnie arytmetyczne Y oraz X. Równoważny wzór na ocenę a ma postać:

Wartość oceny a parametru α informuje, o ile jednostek zmieni się zmienna objaśniana Y, jeśli zmienna objaśniająca X zmieni się o jednostkę.

Specyficznym modelem liniowym z jedną zmienną objaśniającą jest liniowy model tendencji rozwojowej (trend liniowy) o postaci:

gdzie t oznacza zmienną czasową.

Wzory na oceny parametrów strukturalnych trendu liniowego są podobne do poprzednich z tym, że zamiast zmiennej X występuje zmienna czasowa t. W wypadku oceny a można także skorzystać z prostszego wzoru o postaci:

,

Wzór ten otrzymuje się z poprzednich wzorów przy uwzględnieniu następującej własności: jeżeli:

Ocenę wariancji odchyleń losowych modelu liniowego z jedną zmienną objaśniającą otrzymujemy ze wzoru:

Wielkość Se jest odchyleniem standardowym reszt modelu, które informuje, o ile zaobserwowane wartości zmiennej objaśnianej przeciętnie różnią się od teoretycznych wartości tej zmiennej wyznaczonych z modelu.

Standardowe błędy S(a) i S(b) szacunku parametrów strukturalnych α i β wyznacza siκ ze wzorσw:

,   lub  

 

, lub 

 

2.3.Szacowanie parametrów modelu z wieloma zmiennymi objaśniającymi

 

W celu przedstawienia klasycznej metody najmniejszych kwadratów w zastosowaniu do szacowania parametrów modelu z wieloma zmiennymi objaśniającymi:

wprowadzamy symbolikę macierzową:

- wektor obserwacji zmiennej objaśnianej;

- macierz obserwacji zmiennych objaśniających;

- wektor ocen parametrów strukturalnych;

- wektor reszt modelu.

Kryterium najmniejszych kwadratów w tym wypadku można zapisać następująco:

,

gdzie: .

Wzór na wektor a ocen parametrów strukturalnych modelu jest następujący:

Wariancję odchyleń losowych szacuje się na podstawie wzoru:

Macierz wariancji i kowariancji ocen parametrów strukturalnych szacuje się na podstawie wzoru:

.

W macierzy tej elementy na głównej przekątnej są wariancjami V(ai) (i=0, 1, ..., k) ocen parametrów strukturalnych. Wielkości:

są standardowymi błędami szacunku parametrów strukturalnych.

 

3. Weryfikacja modeli liniowych

 

3.1.Uwagi wstępne

 

Po oszacowaniu parametrów modelu należy zbadać, czy zbudowany model dobrze opisuje badane zależności. Jeśli okaże się, że rozbieżność między otrzymanym modelem, a dymami empirycznymi lub między otrzymanym modelem a wiedzą ekonomiczną o badanych zależnościach jest duża, wówczas należy go skorygować oraz poprawić.

Przyczyny powodujące złą jakość modelu ekonometrycznego mogą się pojawiać już w początkowych etapach badanie ekonometrycznego. Nigdy nie ma pewności, czy zostały dobrane odpowiednie zmienne objaśniające. Wątpliwości może budzić także dobór analitycznej postaci modelu. W samym procesie estymacji mogła też być zastosowana niewłaściwa metoda szacowania parametrów. Wszystko to powoduje potrzebę przeprowadzenia weryfikacji modelu przed jego wykorzystaniem do wnioskowania o badanych zależnościach.

Weryfikacja modelu sprowadza się do zbadania trzech własności:

Stopnia zgodności modelu z danymi empirycznymi;

Jakości ocen parametrów strukturalnych;

Rozkładu odchyleń losowych.

 

3.2. Ocena dopasowania modelu do danych empirycznych

 

Ocena dopasowania modelu do danych empirycznych ma na celu sprawdzenie, czy model ten w wystarczająco wysokim stopniu wyjaśnia kształtowanie się zmiennej objaśnianej. Do tego celu służą różne miary zgodności modelu z danymi empirycznymi. Podstawowymi miarami tego typu są: odchylenie standardowe reszt, współczynnik zmienności losowej, współczynnik zbieżności i współczynnik determinacji.

Współczynnik zmienności losowej jest zdefiniowany następująco:

Współczynnik ten informuje, jaki procent średnia arytmetycznej zmiennej objaśnianej modelu stanowi odchylenie standardowe reszt. Mniejsze wartości współczynnika We wskazują na lepsze dopasowanie modelu do danych empirycznych.

Jeśli dla założonej z góry krytycznej wartości współczynnika zmienności losowej W* (np. W*=10%) zachodzi nierówność: , to model uznaje się za dostatecznie dobrze dopasowany do danych empirycznych. Przy przeciwnym kierunku nierówności dopasowanie uznaje się za zbyt słabe. Współczynnik zmienności losowej ma także zastosowanie przy przeprowadzaniu porównania stopnia zgodności z danymi empirycznymi modeli opisujących się kształtowanie różnych zmiennych objaśnianych.

Współczynnik zbieżności wyraża się wzorem:

Współczynnik zbieżności przyjmuje wartości z przedziału [0; 1]. Informuje on jaka część całkowitej zmienności zmiennej objaśnianej nie jest wyjaśniona przez model. Dopasowanie modelu do danych jest tym lepsze, im współczynnik zbieżności jest bliższy zeru.

Współczynnik determinacji ma postać:

Współczynnik  determinacji przyjmuje wartości z przedziału [0;1]. Informuje on, jaką część całkowitej zmienności zmiennej objaśnianej stanowi zmienność wartości teoretycznych tej zmiennej, tj. część zdeterminowana przez zmienne objaśniające. Dopasowanie modelu do danych jest tym lepsze, im współczynnik determinacji jest bliższy jedności.

Między współczynnikami zbieżności i determinacji zachodzi relacja:

Pierwiastek kwadratowy ze współczynnika determinacji, tj. R, jest znanym współczynnikiem korelacji wielorakiej.

Aby stwierdzić, czy dopasowanie modelu do danych empirycznych jest dostatecznie duże, można zweryfikować hipotezę o istotności współczynnika korelacji wielorakiej tj. hipotezę zerową postaci:

wobec hipotezy alternatywnej . Sprawdzianem tej hipotezy jest statystyka:

Statystyka ta ma rozkład F Fishera-Snedecora o m1=k oraz m2=n-k-1 stopniach swobody. Z tablic testu F dla zadanego poziomu istotności γ oraz m1 i m2 stopni swobody odczytuje się wartość krytyczną F*. Jeśli F£F*, to nie ma podstaw do odrzucenia hipotezy H0. Oznacza to, że współczynnik korelacji wielorakiej jest nieistotnie różny od zera, a dopasowanie modelu do danych jest zbyt słabe. Natomiast jeśli F>F*, to hipotezę H0 należy odrzucić na rzecz hipotezy H1. Współczynnik korelacji wielorakiej jest istotny, a stopień dopasowania modelu do danych jest dostatecznie wysoki.

 

3.3. Badanie istotności parametrów strukturalnych

 

Badanie istotności parametrów strukturalnych α1, α2,..., αk, liniowego modelu ekonometrycznego ma na celu sprawdzenie, czy zmienne objaśniające istotnie oddziaływają na zmienną objaśnianą, czy też nie. Dla każdego i=1,2,...,k weryfikuję się hipotezę zerową H0: [αi=0] wobec hipotezy alternatywnej H1: [αi≠0]. Sprawdzianem tej hipotezy jest statystyka:

gdzie ai – wartość oceny parametru strukturalnego αi; S(ai) – standardowy błąd szacunku tego parametru.

Z tablic testu t-Studenta dla przyjętego poziomu istotności γ oraz dla n-k-1 stopni swobody odczytuje się wartość krytyczną I*. Jeśli Ii £I*, nie ma podstaw do odrzucenia hipotezy H0. Parametr strukturalny αi różni się nieistotne od zera, a zmienna objaśniająca Xi nie wpływa w istotny sposób na zmienną objaśnianą Y. Natomiast jeśli I...

Zgłoś jeśli naruszono regulamin