5
II. Podstawowe pojęcia wnioskowania statystycznego:
(na podstawie: Aronson & Aronson „Statistics for Psychology” rozd. 6, 1999)
Wprowadzenie do testowania hipotez
Testowanie hipotez to systematyczna procedura służąca do oceny, czy rezultaty eksperymentu (przeprowadzonego na próbie) popierają określoną teorię lub praktyczną innowację (które będą odnosić się do całej populacji). Wielu studentom trudno jest dobrze zrozumieć i opanować podstawowy sposób myślenia związany z testowaniem hipotez. Dlatego podstawowe i nowe pojęcia z tego zakresu będą wprowadzane na bardzo prostych, czasem z konieczności dziwacznych przykładach badań na jednej osobie.
PRZYKŁAD TESTOWANIA HIPOTEZY
W ramach dużego projektu badawczego małym dzieciom podawano specjalną odżywkę i obserwowano ich rozwój w ciągu pierwszych dwu lat życia. Mniej niż 2% dzieci (dalej niż dwa odchylenia standardowe poniżej średniej) zaczyna chodzić w wieku 8 miesięcy.
W oparciu o nowe teorie pewien badacz wywnioskował, że gdyby oczyścić tę odżywkę i stworzyć na jej podstawie odżywkę o większej zawartości składnika Turbo, miałoby to ogromny wpływ na rozwój dzieci: te, które otrzymywałyby „oczyszczoną” odżywkę, zaczęłyby chodzić znacznie wcześniej (zakładamy tu, że jest absolutnie pewne, że przez proces oczyszczania odżywka nie stałaby się szkodliwa). Jednak takie oczyszczanie odżywki jest bardzo kosztowne. Zatem zespół badawczy decyduje się na zastosowanie tylko jednej dawki dla jednego dziecka. Losowo wybierają jedno dziecko, które otrzymuje wysoce oczyszczoną dawkę odżywki i obserwują jego rozwój. Jakie wyniki powinny doprowadzić badaczy do wniosku, że Oczyszczona Turbo-Odżywka pomaga dziecku wcześniej chodzić?
To jest przykład testowania hipotezy. Badacze chcą wyciągnąć wniosek dotyczący teorii, że Oczyszczona Turbo-Odżywka pozwala dzieciom na szybszą naukę chodzenia, opierając się na informacjach uzyskanych w próbie (w tym przykładzie - w badaniu jednego dziecka.)
RDZEŃ LOGIKI TESTOWANIA HIPOTEZ
Istnieje pewien standardowy sposób podchodzenia do testowania hipotez (pozwolimy tu sobie na pewne generalne uproszczenie, aby podkreślić rdzeń tego postępowania). Badacz zacznie myśleć w sposób następujący. Normalnie prawdopodobieństwo tego, że dziecko zacznie chodzić w wieku 8 miesięcy lub wcześniej, jest mniejsze niż 2%. Zatem jeśli dziecko przez nas badane zacznie chodzić w takim wieku, będziemy mogli odrzucić tezę, że specjalnie Oczyszczona Turbo-Odżywka nie ma wpływu. A jeśli odrzucimy tę tezę, to musimy przyjąć tezę przeciwną, czyli że Oczyszczona Turbo-Odżywka ma wpływ.
Po sformułowaniu tych warunków, które pozwalają zdecydować, czy specjalna procedura oczyszczania ma jakiś wpływ na działanie odżywki, badacz może przeprowadzić badanie: zaobserwować, jak wcześnie zacznie chodzić dziecko, które otrzyma Oczyszczoną Turbo-Odżywkę, i na tej podstawie sformułować wnioski.
Ten okrężny sposób rozumowania - założyć to, czego nie przewidujemy - jest samym rdzeniem wnioskowania statystycznego w psychologii. Przypomina to trochę podwójne przeczenie. Ważną przyczyną dla tekiego sposobu rozumowania jest to, że to właśnie dla hipotezy o braku różnic możemy uzyskać potrzebne informacje. W naszym przykładzie badacze wiedzą, jak wcześnie dzieci zaczynają chodzić, kiedy nie dostają Oczyszczonej Turbo-Odżywki - będzie to zgodne ze znanym już rozkładem wieku, w jakim dzieci zaczynają chodzić.
Okazuje się także, że bez tak pokrętnego podejścia problem często wcale nie może zostać rozwiązany. W naszym przykładzie sama obserwacja dziecka po podaniu Oczyszczonej Turbo-Odżywki nie prowadzi do żadnych wniosków na temat ewentualnego przyspieszenia w jego rozwoju. Później przekonacie się, że jest to kwestia dosyć powszechna. Praktycznie we wszystkich badaniach psychologicznych, także w eksperymentach, dochodzimy do ostatecznych wniosków poprzez ocenę prawdopodobieństwa uzyskania wyników eksperymentu nie potwierdzających naszego sposobu myślenia i naszych hipotez.
PROCES TESTOWANIA HIPOTEZY
Teraz przeanalizujemy dokładnie kolejne etapy testowania hipotezy wprowadzając przy tym odpowiednie pojęcia statystyczne.
Krok 1. Przekształcenie pytań w hipotezy badawcze oraz hipoteza zerowa o populacjach
Na początek zauważmy, że badacze są zainteresowani dziećmi w ogóle, nie tylko tym jednym przypadkiem, a zatem warto sformułować pytanie w kategoriach populacji. W naszym przykładzie możemy dla potrzeb analizy myśleć o wszystkich dzieciach jako należących do jednej z dwu grup:
populacja 1: dzieci, które biorą Oczyszczoną Turbo-Odżywkę
populacja 2: dzieci, które nie biorą Oczyszczonej Turbo-Odżywki
(chociaż znamy tylko jedno dziecko z populacji 1, reprezentuje ona wszystkie nienarodzone dzieci, wobec których badacze chcą zastosować swoje wyniki.)
Przewidywanie badacza, oparte na pewnej teorii, mówi, że dzieci z populacji 1 (które biorą) zaczną chodzić wcześniej niż dzieci z populacji 2 (które nie biorą). Takie stwierdzenie, dotyczące przewidzianej przez teorię (lub doświadczenie) relacji między populacjami, nazywamy hipotezą badawczą.
Jeśli jednak to przewidywanie jest błędne, wydarzy się inna sytuacja: dzieci z populacji 1 nie będą chodzić wcześniej niż dzieci z populacji 2. To przewidywanie przeciwne mówi, że nie będzie różnic: dzieci z obu populacji będą zaczynały chodzić w takim samym czasie. Takie stwierdzenie, dotyczące przeciwnego do wynikającego z teorii przewidywania relacji między populacjami, nazywamy hipotezą zerową. Nazwa ta oznacza, że przewiduje ona brak różnic (różnicę zerową) między populacjami. Oczywiście jeśli hipoteza badawcza zakłada kierunek relacji (tzn. w której populacji wyniki są lepsze), to hipoteza zerowa obejmuje także przeciwny kierunek relacji.
Zauważmy, że hipoteza badawcza i hipoteza zerowa są sobie przeciwne i wzajemnie się wyłączają - jeśli jedna jest prawdziwa, druga musi być nieprawdą. Ta opozycja jest sercem testowania hipotez. Z tego właśnie powodu hipotezę badawczą, która przecież mówi o tym, że miejsce mają rzeczy przeciwne do sformułowanych w hipotezie zerowej, nazywana jest „hipotezą alternatywną”. Wygląda to trochę ironicznie: z naszego punktu widzenia najważniejsza jest hipoteza badawcza, ale z punktu widzenia procedury testowania hipotez jedyną jej rolą jest bycie hipotezą alternatywną.
Krok 2. Określanie cech rozkładu porównawczego
Teraz, gdy już przekształciliśmy pytania w możliwość wyboru pomiędzy hipotezą zerową a badawczą, rozważymy, jak informacje uzyskane w próbie możemy odnieść do tych dwu hipotez. Znając wynik uzyskany w próbie (w naszym przykładzie jeden wynik) zadajemy sobie teraz pytanie: jakie jest prawdopodobieństwo otrzymania takiego wyniku, gdy hipoteza zerowa jest prawdziwa?
Odpowiedź leży w założeniu, że próba została wybrana z rozkładu, który odpowiada sytuacji, gdy hipoteza zerowa jest prawdziwa. W naszym przykładzie cechy tego rozkładu są znane: ma określoną średnią i odchylenie standardowe, a oprócz tego (jak zakłada się w większości przypadków) ma rozkład normalny. Na tej podstawie możemy obliczyć prawdopodobieństwo tego, że dowolna próba została wzięta z tego właśnie rozkładu.
W naszym przykładzie, jeśli hipoteza zerowa jest prawdziwa, to badane dziecko pochodzi z populacji o rozkładzie normalnym ze średnią 14 miesięcy i odchyleniem standardowym 3 miesiące. Jest tak, ponieważ jeżeli hipoteza zerowa jest prawdziwa, to populacje 1 i 2 są takie same i mają takie same, znane nam cechy populacji 2. Pozwala nam to podać dokładne prawdopodobieństwo wybrania próby z dowolnej części tego rozkładu. Na przykład prawdopodobieństwo wybrania dziecka, które zacznie chodzić w wieku 14 miesięcy lub wcześniej, wynosi 50%; dziecka, które zacznie chodzić w wieku 11 miesięcy lub wcześniej wynosi 16% itd.
Rozkład reprezentujący sytuację, w której hipoteza zerowa jest prawdziwa, nazywamy rozkładem porównawczym (czasem nazywa się też „modelem statystycznym” lub „rozkładem z próby”, co omówimy innym razem). W naszym przykładzie rozkład porównawczy to rozkład populacji 2, tej, w której nie zastosowano oddziaływania eksperymentalnego.
Krok 3. Określanie wartości krytycznej, poza którą hipoteza zerowa powinna być odrzucona.
W idealnej sytuacji, zanim badacz rozpocznie obserwacje, określa jakie wyniki będą wystarczająco skrajne, aby odrzucić hipotezę zerową. W naszym przykładzie badacz mógłby zadecydować, że jeśli hipoteza zerowa jest prawdziwa (czyli branie odżywki nie ma wpływu na rozwój dziecka), to zaobserwowanie, że dziecko zaczyna chodzić w wieku 8 miesięcy lub wcześniej byłoby czymś szczególnym. Zatem, ponieważ jest to 2 odchylenia standardowe poniżej średniej, chodzenie w wieku 8 miesięcy pojawi się w mniej niż dwu procentach przypadków. Przez badanie rozkładu porównawczego, badacz może zadecydować, nawet przed obserwowaniem dziecka nakarmionego Oczyszczoną Turbo-Odżywką, że jeżeli dziecko zacznie chodzić w wieku 8 miesięcy lub wcześniej, odrzuci hipotezę zerową.
Jednak jeżeli obserwowane dziecko nie zacznie chodzić przed upływem wyznaczonego terminu, badacz nie może przyjąć hipotezy zerowej. Taki wynik - nieodrzucenie hipotezy zerowej - sprawia, że badanie jest niekonkluzywne, tzn. nie pozwala na wyciągnięcie jednoznacznych wniosków. Nie dowodzi niczego.
Badacze na ogół nie podają granicy w postaci liczby jednostek na skali pomiarowej (np. miesięcy) - zamiast tego określają ją podając prawdopodobieństwo i związaną z nim wartość z. W naszym przykładzie badacz zadecydował, że jeśli rezultat będzie mniej prawdopodobny niż 2% (wartość z wyniesie mniej niż -2), odrzuci hipotezę zerową. W tym przypadku wartość krytyczna to 8 miesięcy, czyli z = -2.
Załóżmy, że badacz był jeszcze bardziej ostrożny i przyjął, że odrzuci hipotezę zerową tylko wtedy, gdy prawdopodobieństwo otrzymania danego wyniku będzie wynosiło najwyżej 1%. Powinien wtedy sięgnąć do tablic statystycznych i na ich podstawie stwierdzić, że wartość o prawdopodobieństwie najwyżej 1% przy krzywej normalnej znajduje się poniżej punktu o wartości z = -2.33 (odpowiada to 7 miesiącom w naszym przykładzie). Na rysunku 6-2 zacieniono obszar o prawdopodobieństwie 1%: jeśli wynik uzyskany w próbie należy do tego obszaru, zostanie uznany za tak skrajny, że odrzucimy hipotezę, że pochodzi on z populacji o tym właśnie rozkładzie.
Na ogół w psychologii korzysta się z wartości krytycznej wyznaczającej obszar o prawdopodobieństwie 5%. Zatem hipoteza zerowa zostaje odrzucona, jeśli prawdopodobieństwo uzyskania naszego wyniku przy założonym rozkładzie porównawczym jest mniejsze niż 5%. Zazwyczaj oznacza się takie prawdopodobieństwo jako „p < .05”. Niemniej w niektórych obszarach badawczych, albo gdy badacz jest szczególnie ostrożny, przyjmuje się wartość krytyczną na poziomie 1% (p < .01).
Są to konwencjonalne poziomy istotności statystycznej, opisywane jako poziom istotności .05 i poziom istotności .01. Gdy wartość otrzymana w próbie jest tak skrajna. że odrzucamy hipotezę zerową, mówimy że wynik jest istotny statystycznie. Później dokładniej omówimy jak wybrać poziom istotności statystycznej.
Krok 4. Umieszczenie wyniku uzyskanego w próbie na rozkładzie porównawczym
Określiliśmy już wartość krytyczną z: jeśli nasz wynik znajdzie się w obszarze poza tą wartością, hipoteza zerowa zostanie odrzucona. Teraz musimy przeprowadzić badanie i uzyskać wynik surowy z naszej próby. Następnie obliczyć, jaką ten wynik ma wartość z na rozkładzie porównawczym.
W naszym przykładzie badacz śledził rozwój dziecka, któremu podano Oczyszczoną Turbo-Odżywkę. Dziecko zaczęło chodzić w 6 miesiącu życia. Pamiętamy, że średnia w rozkładzie porównawczym wynosi 14 mies., a odchylenie standardowe - 3 mies. 6 miesięcy to 8 miesięcy poniżej średniej, czyli z = -2.67. Rys 6-3 pokazuje gdzie ta wartość znajduje się na rozkładzie porównawczym.
Krok 5. Zadecydowanie czy odrzucić hipotezę zerową, czy nie
Ten krok jest praktycznie automatyczny: skoro wiemy (a) przy jakiej wartości z odrzucamy hipotezę zerową, a przy jakiej nie (krok 3) i (b) jaką wartość z ma wynik uzyskany przez nas w próbie (krok 4), to wystarczy szybko porównać te wartości. W naszym przykładzie (a) wartość krytyczna z wynosi -2 i odrzucamy hipotezę zerową, jeśli wynik w próbie będzie niżej, oraz (b) wartość z wyniku z próby wynosi - 2.67. Zatem odrzucamy hipotezę zerową. (Nawet gdybyśmy przyjęli poziom istotności 1%, to odrzucilibyśmy hipotezę zerową, (rys. 6-2)bo wartość krytyczna dla 1% wynosi w tym przypadku z = -2.33.)
Skoro odrzuciliśmy hipotezę zerową, pozostaje nam hipoteza badawcza (alternatywna). W takiej sytuacji zespół badawczy może dojść do wniosku, że rezultaty badania popierają hipotezę zerową.
Kilka uwag o odrzuceniu i nieodrzuceniu hipotezy zerowej
Podkreślimy teraz dwie kwestie związane z interpretacją wyników procedury testowania hipotezy. Po pierwsze, nawet jeżeli można odrzucić hipotezę zerową i uzyskać poparcie dla hipotezy badawczej, nie można powiedzieć, że „jest to dowód” hipotezy badawczej, lub że wyniki badania pokazują, że hipoteza badawcza „jest prawdziwa”. Takie wnioski są za daleko posunięte, ponieważ wyniki zawsze opierają się na prawdopodobieństwie związanym z jedną próbą, a odnoszą się do populacji. „Dowód” i „prawdziwy” zarezerwowane są dla logiki i matematyki; użycie tych określeń wobec wniosków z badań naukowych tchnie amatorszczyzną. (Można oczywiście używać ich w rozważaniach hipotetycznych „jeśli hipoteza jest prawdziwa, to...”, ale nie w odniesieniu do wyników badania.)
Po drugie, kiedy wyniki w próbie nie są dość skrajne, aby odrzucić hipotezą zerową, nie mówimy, że wyniki „popierają hipotezę zerową”. Taki wynik oznacza tylko, że badanie jest niekonkluzywne. Chociaż wynik nie jest dość skrajny, aby odrzucić hipotezę zerową, może ona być fałszywa (a hipoteza badawcza prawdziwa). Przypuśćmy, że w naszym badaniu Oczyszczona Turbo-Odżywka miała niewielki, ale faktyczny wpływ. W takiej sytuacji nie moglibyśmy oczekiwać, że dowolne dziecko po otrzymaniu tej odżywki zacznie chodzić dużo wcześniej niż wszystkie pozostałe dzieci. Najlepszą metodą odkrycia takiego niewielkiego wpływu byłoby przeprowadzenie badania na dużej grupie dzieci otrzymujących odżywkę. Jeśli w większości przypadków zaczęłyby one chodzić choć trochę wcześniej niż dzieci, które nie dostały odżywki, możnaby pokazać, że nie da się utrzymać hipotezy zerowej (będziemy o tym jeszcze mówić).
Aby pokazać, że hipoteza zerowa jest prawdziwa, potrzebowalibyśmy wyników potwierdzających założenie, że nie istnieje różnica między populacjami (lub istnieje różnica w odwrotnym kierunku). Jednak zawsze istnieje możliwość, że różnica była, ale mniejsza niż badanie było w stanie wykryć. Dlatego właśnie wyniki nie pozwalające odrzucić hipotezy zerowej są niekonkluzywne. Czasem jednak, jeśli przeprowadzono wiele badań na dużych próbach i z użyciem dokładnych procedur pomiarowych, zebrany materiał może konsekwentnie ułożyć się w poparcie hipotezy zerowej. Może też zdarzyć się, że badacz mówiąc niedbale opisze niemożność odrzucenia hipotezy zerowej jako jej poparcie. Z punktu widzenia statystyki jest to jednak za daleko idący wniosek na podsumowanie jednego badania.
Zestawienie kroków w procedurze testowania hipotezy
DRUGI PRZYKŁAD TESTOWANIA HIPOTEZY
Dwaj psychologowie przeprowadzają badanie na temat związku zadowolenia z pozytywnymi wydarzeniami. Twierdzą, że jeśli ludziom przydarzy się coś pozytywnego, są przez to bardzo zadowoleni i to poczucie zostaje im na długo. Aby to sprawdzić planują taki eksperyment: losowo wybiorą dorosłego Amerykanina i dadzą mu 1 milion dolarów. Sześć miesięcy później zmierzą jego zadowolenie. Wiadomo już, że rozkład zadowolenia wśród dorosłych Amerykanów jest taki jak na rys. 6-4. Przy użytym teście średnia wynosi 70, odchylenie standardowe 10 i rozkład jest w przybliżeniu normalny.
Teraz badacze posługują się procedurą testowania hipotez. Zanim wykonają badanie rozważą, jak zadowolona musiałaby być ta osoba, aby mogli odrzucić hipotezę zerową (że otrzymanie takiej ilości pieniędzy nie wpływa na zadowolenie po sześciu miesięcach). Jeśli wynik zadowolenia uzyskany po sześciu miesiącach będzie dostatecznie wysoki, badacze odrzucą hipotezę zerową i dojdą do wniosku, że otrzymanie miliona dolarów zwiększa zadowolenie po sześciu miesiącach. Jeśli jednak wynik nie będzie dość skrajny, nie będzie można odrzucić hipotezy zerowej, a badanie będzie niekonkluzywne.
populacja 1: ludzie, którzy 6 miesięcy temu otrzymali 1 mln $
populacja 2: ludzie, którzy 6 miesięcy temu nie otrzymali 1 mln $
Hipoteza badawcza: ludzie w populacji 1 są bardziej zadowoleni niż ludzie w populacji 2
Hipoteza zerowa: Ludzie w populacji 1 nie są bardziej zadowoleni niż ludzie w populacji 2
Rozkład zadowolenia w populacji 2, taki sam jak rozkład zadowolenia dorosłych Amerykanów (średnia wynosi 70, odchylenie standardowe 10 i rozkład jest w przybliżeniu normalny).
Wybrany poziom istotności - 5%
Wg tablic razkładu normalnego z = +1.64
Wartość krytyczna x = 70 + 1.64 x 10 = 86.40
Wyniki: po sześciu miesiącach badacze zmierzyli poziom zadowolenia badanego (teraz już bogatego). Jego wynik to 80. Wynik ten ma wartość z = +1.
80 < 86.40
Hipoteza zerowa nie może zostać odrzucona. Wyniki są niekonkluzywne. Wyniki nie są istotne statystycznie. Rys. 6-5
Może was zainteresować, że Brickman, Coates i Janoff-Bulman (1978) przyprowadzili badanie na podobny temat. Potraktowali zwycięzców loterii jako reprezentantów ludzi, którym nagle zdarzyło się coś bardzo dobrego. Wyniki były podobne do tych w przykładzie: po sześciu miesiącach ci, którzy wygrali, nie byli bardziej zadowoleni niż ci, którzy nie wygrali. Podobnie w drugiej grupie, którą badali: ludzie którzy w wyniku wypadku stali się *paraplegics*, nie byli po sześciu miesiącach mniej zadowoleni od innych. Ponieważ ci badacze badali bardzo duże grupy ludzi i używali różnych miar, te wyniki sugerują, że jeśli ważne zdarzenie nie ma trwałego wpływu na zadowolenie i poczucie szczęścia, nie jest najwyraźniej dość wielkie. Więc wygląda na to, że loteria nie da nam szczęścia.
JEDNO- I DWUSTRONNE TESTOWANIE HIPOTEZ
W dotychczasowych przykładach hipotezy badawcze dotyczyły zawsze sytuacji, w których łatwo było powiedzieć, czy badana populacja powinna mieć wyższe czy niższe wyniki w porównaniu z drugą populacją. W pierwszym przykładzie dziecko, któremu podano Oczyszczoną Turbo-Odżywkę miało zacząć chodzić wcześniej od innych dzieci, a w drugim przykładzie człowiek, który otrzymał 1 mln $ miał być bardziej zadowolony od innych ludzi. W tych badaniach nie bylibyśmy zainteresowani efektami odwrotnymi.
Hipotezy kierunkowe i testy jednostronne
Te badania podają przykłady hipotez kierunkowych. W każdym z tych przykładów badacze zaproponowali kierunek zależności. Większość badań w psychologii zawiera hipotezy kirunkowe.
Kiedy badacz stawia kierunkową hipotezę badawczą, hipoteza zerowa też z konieczności jest kierunkowa. Jeśli hipoteza badawcza mówi, że otrzymanie 1 mln $ czyni ludzi bardziej zadowolonymi, to hipoteza zerowa mówi, że to samo wydarzenie nie ma żadnego wpływu, albo czyni ich mniej zadowolonymi. W takiej sytuacji do odrzucenia hipotezy zerowej wynik uzyskany w próbie musiał się znajdować w górnych 5% rozkładu - w górnym ekstremum krzywej normalnej, tylko po tej stronie. Z tego powodu nazywamy taki test jednostronnym.
Hipotezy niekierunkowe i testy dwustronne
Czasem jednak hipoteza badawcza mówi jedynie tyle, że jedna populacja różni się od drugiej, bez określania kierunku różnicy. Np. psycholog pracowniczy mógłby być zainteresowany wpływem treningu umiejętności społecznych na produktywność. Może być tak, że trening ten poprawi produktywność, gdyż środowisko, w którym odbywa się praca stanie się przyjemniejsze. Może być też tak, że pogorszy produktywność, gdyż zachęci ludzi do kontaktów towarzyskich w miejscu pracy. W takiej sytuacji hipoteza badawcza będzie mówić jedynie o tym, że trening wpływa na produktywność. Hipoteza zerowa zaś, że trening nie ma ani dodatniego ani ujemnego wpływu na produktywność.
Hipotezę badawczą, która mówi o istnieniu różnicy, bez pokazywania jej kierunku, nazywamy hipotezą niekierunkową. Aby ją przetestować, trzeba sprawdzić, czy wynik jest skrajny na którejkolwiek z dwu stron rozkładu porównawczego. Dlatego nazywamy taki test dwustronnym.
Wyznaczanie wartości krytycznych w teście dwustronnym
...
deidre