3_tresc.doc

(296 KB) Pobierz

Moduł IV

Weryfikacja hipotez statystycznych

 

4.1. Weryfikacja (testowanie) hipotez statystycznych – podstawowe pojęcia

              Hipotezą statystyczną nazywamy osąd (przypuszczenie) spełniający dwa warunki:

-          dotyczy rozkładu (lub jego parametrów) w zbiorowości generalnej;

-          słuszność jego da się sprawdzić (zweryfikować) na podstawie wyników z badania reprezentacyjnego.

Taki osąd może powstać w oparciu o logiczne przesłanki lub obserwacje dotyczące badanego zjawiska.

Rozróżniamy (podobnie, jak przy estymacji) hipotezy parametryczne i nieparametryczne. Pierwsze z nich dotyczą parametrów rozkładu (np. średniego poziomu cechy lub jej dyspersji), drugie natomiast – charakteru (rodzaju) rozkładu (np. przypuszczamy, że zmienna X w zbiorowości generalnej ma rozkład normalny).

Metodę weryfikacji hipotez statystycznych nazywamy testem (testowaniem) statystycznym. Jest to reguła postępowania, określająca sposób sprawdzania słuszności hipotezy oraz warunki, w których podejmujemy decyzje, że dana hipoteza jest słuszna (należy ja przyjąć), lub że jest niesłuszna (należy ja odrzucić). Ponieważ weryfikacji dokonujemy w oparciu o wyniki próby losowej (a nie badania całkowitego), należy się liczyć z możliwością popełnienia błędu (podjęcia niewłaściwej decyzji co do słuszności weryfikowanej hipotezy). Rozróżniamy tu dwa rodzaje błędów:

a)      Na podstawie wyników z próby podejmujemy decyzję o odrzuceniu hipotezy, podczas, gdy w rzeczywistości jest ona słuszna ( o tym, można by się przekonać jedynie na podstawie badania całkowitego); jest to tzw. błąd pierwszego rodzaju. Prawdopodobieństwo popełnienia tego błędu oznaczamy najczęściej symbolem a.

b)     Na podstawie wyników z próby podejmujemy decyzję o uznaniu weryfikowanej hipotezy za słuszną (przyjęcie hipotezy) podczas, gdy jest ona w rzeczywistości niesłuszna; jest to tzw. błąd drugiego rodzaju. Prawdopodobieństwo popełnienia takiego błędu oznaczamy symbolem b.

 

Test statystyczny powinien być tak zbudowany, aby zapewnić możliwie małe prawdopodobieństwo podjęcia niesłusznej decyzji. Wartości prawdopodobieństw a i b są jednak ze sobą związane: zmniejszając poziom prawdopodobieństwa a zwiększamy jednocześnie poziom b.

Do najczęściej stosowanych testów statystycznych należy grupa tzw. testów istotności, która stanowi pewien kompromis w stosunku do wymogu minimalizacji prawdopodobieństwa podjęcia fałszywej decyzji. Tego rodzaju testy są tak zbudowane, aby zapewnić możliwie małe prawdopodobieństwo popełnienia błędu drugiego rodzaju, przy określonym z góry, zaakceptowanym przez organizatorów badania prawdopodobieństwie popełnienia błędu pierwszego rodzaju a (tzw. poziom istotności). Ustalamy z reguły niskie (bliskie zeru) wartości poziomu a (np. 0,01; 0,02; 0,05; 0,1). Poziom istotności a określa wiarygodność wyniku weryfikacji. Przyjęcie np. a = 0,05 oznacza, że zgodzimy się z ryzykiem, iż w pięciu przypadkach na 100 podejmujemy na podstawie wyników z próby niesłuszną decyzję o odrzuceniu H0.

Testy istotności określają, w jakich warunkach powinniśmy podjąć decyzję o odrzuceniu hipotezy zerowej, gdy wyniki z próby wskazują na jej fałszywość. Nie dają one natomiast odpowiedzi jaką decyzję należy podjąć w przypadku, gdy wyniki z próby nie wskazują na fałszywość weryfikowanej hipotezy. W takiej sytuacji mówią jedynie, że na podstawie zgromadzonego w próbie materiału statystycznego nie mamy podstaw do jej odrzucenia (nie potrafimy dowieść jej niesłuszności).

Budując test statystyczny wykonujemy kolejno szereg czynności.

 

1.      Definiujemy tzw. hipotezę zerową (H0), czyli hipotezę, która będzie podlegać weryfikacji. W testach istotności formułujemy ją wbrew logicznym przesłankom (czy wynikom z próby), aby prawdopodobieństwo odrzucenia jej było duże. Z reguły jest to hipoteza prosta (mająca tylko jedno rozwiązanie). Np. przy weryfikacji hipotezy o poziomie średniej płacy w badanej gałęzi przemysłu. możemy ją wyrazić: H0: m = 2100 zł (gdzie m jest średnia płacą w zbiorowości generalnej).

 

2.      Dokonujemy wyboru tzw. sprawdzianu hipotezy. Jest to (podobnie, jak estymator w estymacji statystycznej) zmienna losowa o znanym rozkładzie, która w różnych próbach może przyjmować różne wartości. Jeżeli oznaczymy ją symbolem, to w naszej n-elementowej próbce przyjmuje ona konkretna wartość tn, na podstawie której podejmujemy decyzję o słuszności H0. W testach parametrycznych sprawdzianem są estymatory odpowiednich parametrów. I tak np. przy weryfikacji hipotezy przytoczonej w punkcie 1 najlepszym sprawdzianem jest średnia arytmetyczna .

 

3.      Definiujemy tzw. hipotezę alternatywną H1 (konkurencyjną do H0), która może przyjmować wszystkie rozwiązania poza zawartym w H0. Może ona być hipotezą prostą, ale częściej stosujemy tu hipotezę złożoną (zawierającą więcej, niż jedno rozwiązanie). Np. przy H0: m = 2100 zł, hipotezę alternatywną można zdefiniować: zł, lub zł, czy wreszcie zł. Najczęściej H1 jest zgodna z logicznymi przesłankami, lub z wynikami z próby.

 

4.      Ustalamy obszar krytyczny. Sprawdzian jak każda zmienna losowa, charakteryzuje się określonym rozkładem. Graficznie rozkład ten można przedstawić przy pomocy wykresu ograniczającego określoną powierzchnię w układzie współrzędnych. Tę całą powierzchnią (równą jedności) dzielimy na dwa obszary: obszar odrzucenia H0, którego powierzchnia wynosi a i zawiera krytyczny zbiór tych wartości sprawdzianu, które przemawiają za odrzuceniem H0, oraz obszar przyjęcia H0, którego powierzchnia jest równa 1-a. Obszar odrzucenia ustawiamy prawostronnie (gdy wartość parametru w H1 jest większa od jego wartości w H0), lewostronnie (w przeciwnym przypadku) lub dwustronnie (gdy wartość parametru w H1 jest różna od wartości w H0). Wartość sprawdzianu rozdzielającą te dwa obszary (tzw. wartość krytyczna) odczytywana jest z tablic dystrybuanty odpowiedniego rozkładu. W niektórych przypadkach tablice statystyczne zawierają nie dystrybuanty rozkładu, ale wartości krytyczne dla testów dwustronnych, lub jednostronnych (lewostronnych lub prawostronnych).

 

5.      Obliczamy wartość, jaką przyjął sprawdzian w naszej n-elementowej próbie. Jeżeli wynik próby przyjął wartość z obszaru odrzucenia – odrzucamy H0 uznając tym samym, że słuszna jest hipoteza alternatywna H1. Jeżeli wynik ten wpadł do obszaru przyjęcia – w testach istotności stwierdzamy, że nie mamy podstaw do odrzucenia H0.

 

*              Dla pogłębienia tych wiadomości odsyłamy do podręcznika [1], par. 9.1. Należy               zwrócić szczególną uwagę na wykres, który stanowi graficzne przedstawienie               związku między prawdopodobieństwami popełnienia błędów (a i b) przy               podejmowaniu decyzji o słuszności weryfikowanej hipotezy

 

4.2.  Weryfikacja (testowanie) hipotez o wartości przeciętnej

              Wykonujemy kolejno czynności, o których była mowa w paragrafie 4.1.  przy zastosowaniu testów istotności.

1.              Formułujemy hipotezę zerową (hipotezę, którą będziemy weryfikować)

2.        Najlepszym sprawdzianem T (podobnie, jak stwierdziliśmy najlepszym estymatorem) jest średnia arytmetyczna z próby . Rozkład jego zależny jest od rozkładu zmiennej X w zbiorowości generalnej. Mogą tu wystąpić trzy różne sytuacje, w zależności od posiadanych informacji o zbiorowości generalnej. Omówimy je teraz kolejno.

 

A.    Zakładamy, że zmienna X w zbiorowości generalnej ma rozkład normalny . Gdy znamy wartość to, przy założeniu prawdziwości hipotezy zerowej i niezależnym schemacie losowania, sprawdzian ma rozkład normalny , a jego standaryzowana postać:

                                                                                                                              (4.1)

ma rozkład normalny .

 

B.     Jeżeli założymy, że i hipoteza zerowa jest prawdziwa, ale nie znamy wartości , to przy liczebności próby korzystamy z twierdzenia, że sprawdzian :

                                                                                                                              (4.2)

              gdzie s jest odchyleniem standardowym z próby, ma rozkład Studenta o (n-1) stopniach swobody.

 

C.     Bez względu na rozkład zmiennej X w zbiorowości generalnej możemy określić rozkład sprawdzianu losując dużą próbę. Przyjmujemy wtedy, że wartość odchylenia standardowego w próbie jest w przybliżeniu równa tej wartości w zbiorowości generalnej i stosujemy taką samą postać sprawdzianu , jak w przykładzie A, stwierdzając, że przy założeniu prawdziwości hipotezy sprawdzian ma rozkład asymptotycznie normalny. , a jego standaryzowana postać:

                                                                                                                              (4.3)

ma rozkład normalny o parametrach odpowiednio 0  i 1, tzn.

 

3.        Definiujemy hipotezę alternatywną (konkurencyjną do ). W zależności od logicznych przesłanek, lub od wyniku z próby można w niej stwierdzić, że , lub (patrz par. 4.1.).

4.        Ustalamy poziom istotności (prawdopodobieństwo popełnienia błędu I rodzaju), na               który możemy się zgodzić w naszym badaniu oraz określamy obszar odrzucenia (lewostronnie, prawostronnie, lub dwustronnie – w zależności od brzmienia ). Z tablic odpowiedniego rozkładu odczytujemy wartość krytyczną sprawdzianu

5.        Sprawdzamy, czy wartość, jaka przyjął sprawdzian w naszej próbce znalazła się w               obszarze odrzucenia , czy w obszarze przyjęcia. W pierwszym przypadku               odrzucamy hipotezę zerową, mówiącą, że na korzyść hipotezy               alternatywnej. W drugim przypadku stwierdzamy, że nie mamy podstaw do               odrzucenia .

*              Sugerujemy zapoznać się z rozdziałem 9.2  z podręcznika [1] . Należy szczegółowo               prześledzić tok rozumowania w przytoczonych tam przykładach oraz wykresy                             przedstawiające zbiory krytyczne przy weryfikacji różnych hipotez.

 

4.3. Weryfikacja hipotez statystycznych o równości średnich w dwóch zbiorowościach generalnych

 

              W wielu przypadkach otrzymujemy dla prób wylosowanych z dwóch różnych zbiorowości generalnych (lub dwóch podzbiorów tej samej zbiorowości) różne wartości średniej dla badanej zmiennej. Musimy stwierdzić, czy różnica między nimi jest przypadkowa (wynikająca wyłącznie z faktu, że przeprowadzono badania częściowe, a nie całkowite), czy też jest ona statystycznie istotna i świadczy o pewnej prawidłowości. Rozpatrzymy tu dwie sytuacje występujące, w zależności od posiadanych informacji dotyczących badanych zbiorowości. W obu przypadkach najlepszym sprawdzianem jest różnica między średnimi arytmetycznymi z wylosowanych prób .

 

Hipoteza zerowa jest hipotezą prostą i zakłada równość obu średnich w zbiorowościach generalnych: .

 

Rozpatrujemy przypadki:

 

A.    Jeżeli mamy prawo sądzić, że zmienna X w obu zbiorowościach ma rozkład normalny oraz o znanych odchyleniach standardowych, to sprawdzian Z ma przy zastosowaniu niezależnego schematu losowania i założeniu słuszności też rozkład normalny, którego wystandaryzowana postać wyrażona jest wzorem:

                                                                                                                              (4.4)

Ma ona przy założeniu słuszności rozkład , co pozwala na korzystanie z tablic rozkładu normalnego. Wzór ten można stosować bez względu na liczebności prób i .

 

B.     Jeżeli możemy w dalszym ciągu zakładać, że zmienna X ma rozkład normalny, ale nie znamy wartości odchyleń i , to przy małych próbach i przyjęciu założenia, że = oraz zastosowaniu niezależnego schematu losowania oraz założeniu słuszności wystandaryzowana postać sprawdzianu wyraża się wzorem:

                                                        ,                                          (4.5)

gdzie są wariancjami z prób; ma on rozkład Studenta  o liczbie stopni swobody ().

 

C.     Jeżeli możemy operować dużymi próbami ( i , to możemy przyjąć, że oraz i wtedy zastosować schemat z sytuacji A, podstawiając zamiast  i  wartości odchyleń z prób i .

 

              We wszystkich przypadkach dalsze postępowanie przebiega w taki sam sposób, jak opisano w paragrafie 4.1.

 

Na podstawie logicznych przesłanek lub wyników z próby definiujemy ...

Zgłoś jeśli naruszono regulamin