Teoria prognozowania

Logarytmiczna funkcja wiarygodności

          Jedną z pierwszych i nadal szeroko stosowanych metod szacowania parametrów modelu liniowego pozostaje klasyczna metoda najmniejszych kwadratów. Idea szacowania parametrów w tej metodzie polega na zminimalizowaniu błędów dopasowania modelu do danych empirycznych. Przeanalizujmy jednak pewien przykład. Spójrzmy na wykres poniżej.

 

Są to przykładowe dane na temat średniego wynagrodzenia w gospodarce, które wykazują dużą skośność. Średnie wynagrodzenie wynosi według tych danych 2500, podczas gdy zarobki najliczniejszej grupy wynoszą 1700 zł. Załóżmy, że chcielibyśmy przewidzieć ile wynoszą zarobki przypadkowo spotkanej osoby. Najbardziej prawdopodobna prognoza w tym przypadku to 1700 zł, a nie, co wynikałoby ze średniej 2500. Jeżeli zastosowalibyśmy w tym przypadku KMNK (gdzie zmiennymi objaśniającymi mogłyby być dane na temat wieku, wykształcenia, miejsca zamieszkania itp.) to wartość prognozy wyniosłaby właśnie 2500. Natomiast w przypadku, gdy chcielibyśmy zmaksymalizować prawdopodobieństwo trafności prognozy to najbardziej prawdopodobny wynik, jaki byśmy otrzymali to 1700. W metodzie maksymalizacji funkcji wiarygodności maksymalizuje się właśnie prawdopodobieństwo trafności prognoz, a nie jak to ma miejsce w KMNK minimalizuje się błędy dopasowania modelu do danych empirycznych. Stosowanie KMNK jest, więc efektywne jedynie w przypadku, gdy zmienna objaśniana posiada rozkład normalny. Badania przeprowadzone w artykule Modelowanie rozkładu stóp zwrotu wykazały, że stopy zwrotu instrumentów finansowych wykazują liczne odstępstwa od rozkładu normalnego. Nie spełniają  także pozostałych założeń, które muszą zostać spełnione, aby parametry modelu szacowane były na podstawie KMNK. Dotyczy to np. niestałej w czasie wariancji, czy efektu skupiania zmienności. Szacowanie parametrów z wykorzystaniem logarytmicznej funkcji wiarygodności nie wymaga, aby zmienna objaśniana spełniała te założenia. Dlatego w zastosowaniach do finansowych szeregów czasowych jest ona coraz częściej wykorzystywana.

          Szacowanie parametrów w tej metodzie polega na maksymalizacji funkcji wiarygodności, której postać zależy od teoretycznego rozkładu zmiennej zależnej. Jeżeli założymy w tej metodzie, że rozkład danej zmiennej ma rozkład normalny parametry modelu w tym przypadku będą takie same jak w KMNK. W zastosowaniu do finansowych szeregów czasowych często wykorzystuje się jednak rozkład t – bardziej dopasowany do takich danych ze względu na leptokurtozę i grube ogony. Można także zastosować inne znane teoretyczne rozkłady prawdopodobieństwa (np. skośny rozkład t lub rozkład GED). Postać funkcji wiarygodności z zastosowaniem rozkładu t wygląda następująco:

gdzie:

- funkcja gamma

v – stopnie swobody
σ – odchylenie standardowe
ε – błędy modelu (reszty)
T – liczba obserwacji

Funkcję tą maksymalizuje się w sposób numeryczny. Większość pakietów statystycznych posiada wbudowane opcje szacowania parametrów z wykorzystaniem tej metody.

Zobacz także: