Wstęp

Test chi – kwadrat

          W wielu praktycznych zastosowaniach na rykach finansowych zakłada się, że stopy zwrotu z akcji, czy innych instrumentów finansowych mają rozkład normalny. Założenie to występuje np. w przypadku wyznaczania ryzyka metodą VAR, obliczania prawdopodobieństwa zysku lub straty z inwestycji, badania zależności między zmiennymi, prognozowaniu szeregów czasowych, testowaniu hipotez ekonomicznych, czy wyceny opcji. Założenie to występuje więc w najważniejszych obszarach finansów. Testowanie hipotez o rozkładzie danej zmiennym przeprowadza się za pomocą testu chi – kwadrat.
          Ponieważ chcemy się przekonać czy zmienna x ma rozkład normalny, należy najpierw wyznaczyć błędy dopasowania pomiędzy rozkładem rzeczywistym (zaobserwowanym) a rozkładem teoretycznym dla danej zmiennej. Wykres przedstawiający liczebności teoretyczne i empiryczne znajduje się poniżej.

Możemy obliczyć średni błąd dopasowania rozkładu teoretycznego do empirycznego, ze wzoru:

gdzie:

Oi – liczebność empiryczna (zaobserwowana w danym przedziale)
E(Oi) – liczebność teoretyczna wynikająca z rozkładu o którym zakładamy w hipotezie zerowej

Zobaczmy to na przykładzie. Poniżej znajduje się tabelka z liczebnościami teoretycznymi i empirycznymi oraz obliczoną wartość średniego błędu dopasowania, dla danych zaprezentowanych na wykresie powyżej.

Przedział
-∞; -0.10
-0.10; -0.03
-0.03; 0.04
0.04; 0.12
0.12; 0.19
0.19; +
Liczebność empiryczna
15
36
47
39
6
7
Liczebność teoretyczna
18.54
31.62
42.61
34.53
16.82
5.88
Różnice
-3.54
4.38
4.39
4.47
-10.82
1.12
Kwadraty różnic/Liczebność teoretyczna
0.68
0.61
0.45
0.58
6.96
0.21
 
 
 
 
 
Suma
9.49

 

Suma znajdująca się pod tabelką jest standardowym błędem dopasowani wynikającym z odstępstw od rozkładu teoretycznego. Jeżeli chcielibyśmy zbadać czy zmienna X ma rozkład t - studenta, liczebność teoretyczną wyznaczalibyśmy z rozkładu t. Reguła decyzyjna w tym teście wygląda tak samo jak w innych testach statycznych. Jeżeli p-value okaże się mniejsze niż poziom istotności alfa możemy odrzucić hipotezę zerową na korzyść hipotezy alternatywnej. Postać hipotezy zerowej i alternatywnej w tym teście wyglądają następująco:

H0: zmienna x – ma rozkład normalny
H1: zmienna x – nie ma rozkładu normalnego

Statystyka testową weryfikującą hipotezę zerową jest wzór wyprowadzony już wcześniej:

Statystyka ta jest sumą standaryzowanej zmiennej X podniesionej do kwadratu, więc posiada ona rozkład chi - kwadrat z k stopniami swobody. W przypadku testowania hipotez o rozkładzie normalnym liczba stopni swobody będzie się równała k-3 gdzie k – to liczba przedziałów. Zobaczmy, więc jaki otrzymamy wynik dla przykładu umieszczonego powyżej. W naszym przypadku mieliśmy 6 przedziałów, więc liczba stopni swobody wynosi 6-3=3. Z tablic rozkładu chi-kwadrat lub z dowolnego pakietu do analizy danych (np. Gretl) odczytujemy, że dla wartości statystyki równej 9.49 z 3 stopniami swobody p-value wynosi 0,029. Jeżeli przyjmiemy poziom istotności równy 0.05 to należy odrzucić hipotezę zerową. Oznacza to, że zmienna użyta w zaprezentowanym przykładzie nie ma rozkładu normalnego. Zmienna ta to miesięczne stopy zwrotu z indeksu WIG20.

Zobacz także: