statistic IX.doc

(28 KB) Pobierz
Wzór „z” trzeba porównywać z rozkładem normalnym, wzór „t” z rozkładem t Studenta

WYKŁAD IX (25.04.07)

 

Ważne pojęcia:

-          średnia,

-          wariancja, odchylenie standardowe,

-          rozkład zmiennej losowej – mamy zbiór obiektów – przypisujemy im liczby – potem możemy sprawdzić jak często te liczby powtarzają się,

-          prawdopodobieństwo w rozkładzie  normalnym – w rozkładzie normalnym nie mamy prawdopodobieństwa na osi OY, w tym rozkładzie nie możemy również powiedzieć jaka jest szansa uzyskania pojedynczego wyniku,

-          centralne twierdzenie graniczne – z jakiejś np. populacji losujemy pewne grupki (próby) i dla każdej  grupki liczymy coś, np. średnie (rozkład tych średnich będzie rozkładem normalnym).

 

O tym jak wygląda rozkład normalny decyduje tylko średnia i odchylenie standardowe.

 

Wzór „z” trzeba porównywać z rozkładem normalnym, wzór „t” z rozkładem t Studenta.

 

Rozkład t Studenta (przypomnienie): uwzględnia wielkości próbek; jeśli próby są coraz większe staje się bardziej podobny do rozkładu normalnego; ma zawsze średnią 0, jakieś odchylenie standardowe, ma także liczbę stopnia swobody.

 

Co się dzieje, kiedy średnia którą wylosowałem w próbie jest taka sama jak w populacji? Wynik będzie 0.

 

W rozkładzie normalnym można uzyskać wyniki od minus nieskończoności do plus nieskończoności.

 

Im wyższa różnica w mianowniku tym rozkład bardziej przesunięty w prawo.

 

Rozkład normalny nie uwzględnia wielkości próbek, z kolei rozkład t Studenta uwzględnia.

 

Liczba stopnia swobody Fishera; (DF) – gdy mam 10 wyników, które mają mieć określoną średnią, to 1-9 mogą mieć określony wynik, ale dziesiąty zawsze jest taki sam jak średnia.

 

Rozkład t studenta staje się bardziej podobny do normalnego im próby coraz większe. Rozkład t ma zawsze średnią 0.

 

Sytuacja 1: Czy próba pochodzi z populacji o znanych parametrach? Są dwie możliwości: 1. albo próba powstała w wyniku dlatego że wybrałem podzbiór na jakąś cechę (badanie różnicowe); 2. mam populacje ludzi, którzy mnie interesują, wiem coś o tej populacji, wybieram sobie próbę i z tą próbą coś robię.

 

Zadanie: Badacz założył hipotezę zerową i ma hipotezę alternatywną że średnia w próbie jest mniejsza niż średnia w populacji. Przykładowa hipoteza: po spożyciu butelki piwa zakres pamięci jest mniejszy niż przed spożyciem. Czy badacz może odrzucić swoją hipotezę zerową? Może, jeżeli wynik testu t jest istotny statystycznie (test jednostronny wartość pod p z spss należy podzielić przez dwa)

Test dwustronny: Nie mam przewidywania co do kierunku zależności i uważam, że średnia w próbie będzie inna niż średnia w populacji. Nie wiem czy ktoś będzie mieć gorszy zakres pamięci po spożyciu alkoholu, ale wiem, że coś z tego będzie wynikać.

 

Sytuacja 3: po lewej mam wynik t i porównuję z tym samym rozkładem. Mam albo te same osoby badane dwukrotnie, albo osoby połączone w pary (np. małżeństwo). Hipoteza zerowa: Nie ma różnicy między jednym a drugim pomiarem, czyli średnia w pomiarach wynosi 0.

 

Gdy stawiamy hipotezę jednostronną wartość p trzeba podzielić przez 2. SPSS liczy hipotezę dwustronną.

 

Większość badaczy stawia jakąś hipotezę, robi badania. Jak im wyszło coś, dzielą przez 2 i mają wynik. Jak wynik mniejszy niż 0,05 to zgodnie z hipotezą – wynik niższy.

 

Po co komukolwiek potrzebna jest statystyka? Żeby w raporcie móc napisać takie zdanie: średnie zarobki mieszkańców Łodzi wynosiły ..., i były (istotnie) niższe/wyższe od średnich zarobków mieszkańców Warszawy, które wyniosły ...

 

Liczba stopnia swobody w teście t dla dwóch średnich: n1 + n2 – 2

 

Pytanie idealne na egzamin: w jednej grupie było 10 osób, w drugiej 8. Ile wynosi liczba stopnia swobody? 10 + 8 – 2 = 16

 

Czasami możemy podawać wyniki testu t w tabelce, jak jest ich dużo. Jeżeli mamy podać pod rząd więcej niż cztery liczby, wypada podać je w tabelce.

 

Istnieją trzy testy t:

 

1. Dla jednej próby,

2. Dla prób niezależnych,

3. Dla prób zależnych.

 

Kiedy możemy taki test t zastosować? Odpowiedź ortodoksyjna: 1. rozrzut wyników w próbach nie różni się od siebie (inaczej: wariancje są jednorodne) 2. rozkład wyników w każdej próbie musi być podobny do rozkładu normalnego, 3. skala pomiarowa musi być skalą przedziałową. 4. minimalna liczba pomiarów musi wynosić 10 w grupie lub 10 par.

 

Nieortodoksyjna: liczy się tylko to czy wariancje w próbach są jednorodne – jeżeli są, to można stosować test t

 

Co się dzieje kiedy nie spełniamy tych warunków? Możemy zastosować testy nieparametryczne, albo nowoczesną metodę repróbkowania.

3

 

...
Zgłoś jeśli naruszono regulamin