Statystyka 07.06.2009.doc

(111 KB) Pobierz
Kiniuś™

 

 

Kiniuś™

 

Statystyka

Dr Elżbieta Grabowska

(notatki z wykładu 7)

07.06.2009

 

 

 

WNIOSKOWANIE STATYSTYCZNE

 

 

Wnioskowanie statystyczne polega na stosowaniu testów, czyli na podstawie próby losowej, weryfikujemy wnioski o całej populacji.

 

 

Bazą teoretyczną wnioskowania statystycznego jest:

 

Centralne twierdzenie graniczne Linderberga – Levy’ego

 

Przy liczebność próby m zmieniającej do nieskończoności rozkład jest zbieżny do rozkładu normalnego ze średnią m ( i odchyleniem standardowym)

-  średnia  z próby

- średnia z populacji

S odchylenie standardowe

- (mała sigma) odchylenie z populacji

n – liczebność z próby

 

 

Na podstawie tego twierdzenia przyjmuje się że przy dostatecznie dużej próbie rozkład średniej jest w przybliżeniu normalny.

 

Testem statystycznym nazywa się procedurę sprawdzania hipotezy statystycznej na podstawie wyników próby losowej.

 

Hipoteza statystyczna to przypuszczenie, dotyczące rozkładu cechy w populacji lub wartości jego parametrów w populacji.

 

Hipoteza Zerowa (weryfikowana)

Która dla testów istotności różnic i testów niezależności ma zawsze brzmienie przekorne w stosunku do zamierzeń badawczych, czyli zawsze zakłada brak istotnych różnic w populacji lub brak istotnych zależności cech w populacji.

 

Hipoteza Alternatywna

To przypuszczenie, które jesteśmy skłonni przyjąć, gdy odrzucamy hipotezę zerowa.

 

 

!!! Wynik testu jest zawsze prawdopodobny (nigdy 100%) pewny tzn. jest obciążony błędem wnioskowania.

 

Kiniuś™

 

 

Błąd I rodzaju

 

Polega na odrzuceniu hipotezy zerowej mimo, że jest ona prawdziwa.

 

Poziomem istotności p () nazywa się prawdopodobieństwo popełnienia błędu I rodzaju.

 

Wartości p są na ogół , oznacza to, że jest 5% ryzyko błędu we wnioskowaniu o populacji, czyli w 5 przypadkach na 100, wynik testu ma prawo okazać się fałszywy.

 

p=0,05                            ufność wniosku :  1-p =0,95

 

Czyli co najmniej 95% prawdopodobieństwa, że dane w populacji będą takie jak w próbie badanej.

 

 

Błąd II rodzaju

 

Polega na przyjęciu hipotezy zerowej, gdy jest ona fałszywa.

 

Prawdopodobieństwo popełnienia takiego błędu oznacza się

 

Obszarem krytycznym nazywamy zbiór wartości sprawdzanej hipotezy, które przemawiają za odrzuceniem hipotezy zerowej.

 

Obszarem przyjęć nazywamy zbiór wartości, które przemawiają za przyjęciem hipotezy zerowej.

 



 

 

Jeżeli średnia z populacji równa jest czyli wartości powinny się miescić w pewnym obszarze przyjęć.

 

 

Kiniuś™

Hipotezy statystyczne mogą być dwustronne (bezwarunkowe)

i jednostronne (kierunkowe).

 

 

Obszar krytyczny lewostronny:





 

wzrost studentów jest mniejszy od średniej populacyjnej.

 

 

Obszar krytyczny prawostronny:



 



 

 

 

 

 

 

Każdy test statystyczny stosowany jest wg. jednolitej procedury, które obejmują następujące etapy:

 

1) Określenie celu testowania               C

Czy chodzi nam o badanie istotności różnic między grupami czy też o badanie zależności cech w obrębie jednej populacji. Dodatkowo określamy rodzaj danych : jakościowe, porządkowe, ilościowe.

 

2) Sprawdzenie założeń modelowych              M

              To zbiór warunków które muszą spełniać dane, aby można było zastosować dany test.

             

              Wszystkie testy dzielą się na:

 

- parametryczne: wymagają rozkładu normalnego w populacji np. testy studenta, test Lavena, analiza wariancji (w każdej postaci) testy szacowania istotności r Persona.

 

- nieparametryczne: np. test U Mann – Whitney, test Chi2, test szacowania istotności współczynnika korelacji rho Spearmana.

 

Wszystkie testy dla cech jakościowych i porządkowych są nieparametryczne. Większość testów dla cech ilościowych to testy parametryczne.

 

Kiniuś™

 

3) Opis Prób                       P

             

Czyli ustalanie jakie dane z próby są potrzebne, aby można było zastosować

wybrany test.

 

4) Postawienie hipotezy zerowej ewentualnie też hipotezy alternatywnej.

 

5) Weryfikacja hipotezy zerowej                   W

 

              Obliczenie wartości testowej t dla danego testu.

Ustalenie parametrów  wartości krytycznej, przyjmujemy odpowieni poziom p i df (stopni swobody)

 

Parametr df  - im wyższa liczba stopni swobody tym trudniej jest wykazać istotność wniosków dla małej próby.

 

Znalezienie wartości krytycznej w tablicach statystycznych.

 

SWS – sformułowanie wniosku statystycznego

 

 

Jeżeli wartość testowa jest mniejsza lub równa od wartości krytycznej to odrzucamy hipotezę zerową i przyjmujemy że wynik testu jest istotny dla populacji.

 

Jeżeli jest większy lub równy, to jest brak podstaw do odrzucenia hipotezy zerowej i akceptujemy ją.

 

 

 

TEST STUDENTA DLA 1 ŚR.

 

Ustalenie czy średnia różni się istotnie od przyjętej wartości przyjmującej pewną konkretną wartość liczbową.

 

Założenia modelowe:

- 1 populacja

- 1 próba reprezentatywna

- 1 cecha ilościowa wyrażona na skali stosunkowej lub przedziałowej

- rozkład cechy normalny w populacji

 

Uwaga!

 

Normalność rozkładu cechy oceniamy:

- przy niektórych cechach np. wzrost wiadomo, że mają rozkład normalny

- można zastosować test zgodności z rozkładem normalnym

- jeżeli nie przyjmuje wartości ekstremalnych to szacuje się, że wartość z próby świadczy o tym że w populacji przyjmuje rozkład normalny

- przy danych liczebnościach prób ( w praktyce >100os.)jeżeli stosujemy jako narzędzie pomiaru wystandaryzowane i znormalizowane testy psychologiczne to w praktyce można przyjąć, że rozkład pomiaru będzie normalny

 

Kiniuś™

 

Hipoteza zerowa (dwustronna)

 

 

 

 

zad.

 

Producent opon samochodowych podaje ‘długość życia” opony, ma ono rozkład normalny i opona starcza na 50 tys. km. Na podstawie 26 losowo wybranych opon uzyskamy:

 



                                                                                                                                                                                                                                                                                                                                                                                                                                                                 

                                                                                                                                                                                Czy producent ma rację tzn. czy można uznac że średnia z próby nie różni się istotnie od zakładanej średniej populacyjnej?

 

 

t = -3,125



 

             

 

 

              średnia rzeczywista różni się od zakładanej

 

 

 

 

wartości t0,09, t0,02 itd. wzięte z tablic statystycznych



t na poziomie 0,001 nie istotne  (bo 3,745 > 3,125)

t istotne na poziomie 0,05 ; 0,02 ; 0,01 – ryzyka błędu







                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           

 

             

 

Długość życia opon samochodowych różni się istotnie od zakładanego standardu.                           

 

 

 

 

Kiniuś™             

 

Badanie istotności różnic jednej cechy ilościowej dla 2 populacji wymaga zawsze baterii dwóch testów:

 

- Testu Levena dla sprawdzenia istotności różnic między wariancjami             

- Testu Studenta dla 2 prób niezależnych dla sprawdzenia istotności różnic między średnimi

 

 

Zad.             

 

Postanowiono sprawdzić czy poziom wyobraźni przestrzennej kobiet i mężczyzn różni się istotnie. Zestawiono wyniki w punktach testu kwadratów.             

 

Dane:

 



Kobiety                            Mężczyźni



             

 

 

 

 

 

Czy jest istotna różnica miedzy S2 ? – test Lavena

...

Zgłoś jeśli naruszono regulamin