Wnioskowanie statystyczne.doc

(99 KB) Pobierz
Wnioskowanie statystyczne

Wnioskowanie statystyczne

Wnioskowanie statystyczne to dział statystyki zajmujący się problemami uogólniania wyników badania próby losowej na całą populację oraz szacowania błędów wynikających z takiego uogólnienia (patrz badanie statystyczne).

Wyróżnia się dwie grupy metod uogólniania wyników, definiujące jednocześnie dwa działy wnioskowania statystycznego:

·         Estymacja - szacowanie wartości nieznanych parametrów rozkładu

·         Weryfikacja hipotez statystycznych - sprawdzanie poprawności przypuszczeń na temat rozkładu

Próba losowa to uzyskany w wyniku doboru z użyciem doboru losowego podzbiór elementów populacji poddany badaniu statystycznemu, na podstawie którego dokonuje się wnioskowania o danej populacji przy użyciu metod statystycznych.

Przykładowo w badaniu preferencji wyborców populację tworzą obywatele Polski posiadający czynne prawo wyborcze, natomiast próba losowa to tysiąc losowo wybranych członków populacji. Można także przyjąć, że są to ci sami obywatele z założeniem, że będą głosować, lub głosowali. Wyboru respondentów najczęściej dokonuje się wówczas określając ich parametry w odwiedzanych lokalizacjach, które też są wskazane w instrukcji kwestionariusza.

 

Dobór losowy – w statystyce taki dobór próby statystycznej, aby każda jednostka z populacji (przedmiotów, regionów, ludzi, itp.) miała identyczne prawdopodobieństwo znaleźć się w próbie.

 

Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji

 

Rozkład cechy to opis wartości cechy statystycznej przy pomocy prawdopodobieństwa ich występowania.

 

    * Jeśli mamy na myśli rzeczywiste prawdopodobieństwa wystąpienia danej wartości cechy w populacji, to mówimy o rozkładzie cechy w populacji.

 

    * Jeśli mamy na myśli prawdopodobieństwa wystąpienia danej cechy wyznaczone podczas badania statystycznego, to mówimy o rozkładzie empirycznym.

 

I. ESTYMACJA



Estymacja to dział wnioskowania statystycznego będący zbiorem metod pozwalających na uogólnianie wyników badania próby losowej na nieznaną postać i parametry rozkładu zmiennej losowej całej populacji oraz szacowanie błędów wynikających z tego uogólnienia. Wyrażenie nieznana postać jest kluczem do odróżnienia estymacji od drugiego działu wnioskowania statystycznego, jakim jest weryfikacja hipotez statystycznych, w którym najpierw stawiamy przypuszczenia na temat rozkładu, a następnie sprawdzamy ich poprawność.

W zależności od szukanej cechy rozkładu można podzielić metody estymacji na dwie grupy:

·         Estymacja parametryczna - metody znajdowania nieznanych wartości parametrów rozkładu

·         Estymacja nieparametryczna - metody znajdowania postaci rozkładu populacji

W praktyce estymacja nieparametryczna jest zastępowana prostszymi metodami bazującymi na weryfikacji hipotez statystycznych.

Metody estymacji parametrycznej można w zależności od sposobu szacowania szukanego parametru podzielić na dwie grupy:

·         Estymacja punktowa

·         Estymacja przedziałowa

W estymacji punktowej oceną wartości szukanego parametru jest konkretna wartość uzyskana z próby (estymator), natomiast w estymacji przedziałowej operuje się pojęciem przedziału ufności, czyli przedziału, do którego z pewnym prawdopodobieństwem należy szukana wartość.

 

Estymacja przedziałowa to grupa metod statystycznych służących do oszacowania parametrów rozkładu zmiennej losowej w populacji generalnej. Wynikiem oszacowania nie jest tutaj ocena punktowa, tak jak w przypadku metod estymacji punktowej. Można zauważyć, że w przypadku rozkładu ciągłego prawdopodobieństwo, że ocena punktowa parametru przyjmie wartość równą wartości szacowanego parametru wynosi zero. W metodach estymacji przedziałowej oceną parametru nie jest konkretna wartość, ale pewien przedział, do którego z określonym prawdopodobieństwem należy szacowana wartość parametru.


Inny podział metod estymacji wynika ze sposobu doboru wiekości próby.

·         Estymacja z ustaloną wiekością próby

·         Estymacja sekwencyjna

 

 

 

Przedział ufności jest podstawowym narzędziem estymacji przedziałowej. Pojęcie to zostało wprowadzone do statystyki przez amerykańskiego matematyka polskiego pochodzenia Jerzego Spławę-Neymana.

 

Definicja



Przedział ufności Niech cecha X ma rozkład w populacji z nieznanym parametrem θ. Z populacji wybieramy próbę losową (X1, X2, ..., Xn). Przedziałem ufności (θ - θ1, θ + θ2) o współczynniku ufności 1 - α nazywamy taki przedział (θ - θ1, θ + θ2), który spełnia warunek:

P1 < θ < θ2) = 1 − α

gdzie θ1 i θ2 są funkcjami wyznaczonymi na podstawie próby losowej.

Podobnie jak w przypadku estymatorów definicja pozwala na dowolność wyboru funkcji z próby, jednak tutaj kryterium wyboru najlepszych funkcji narzuca się automatycznie - zazwyczaj będziemy poszukiwać przedziałów najkrótszych.

 

Współczynnik ufności 1 - α jest wielkością, którą można interpretować w następujący sposób: jest to prawdopodobieństwo, że rzeczywista wartość parametru θ w populacji znajduje się w wyznaczonym przez nas przedziale ufności. Im większa wartość tego współczynnika, tym szerszy przedział ufności, a więc mniejsza dokładność estymacji parametru. Im mniejsza wartość 1 - α, tym większa dokładność estymacji, ale jednocześnie tym większe prawdopodobieństwo popełnienia błędu. Wybór odpowiedniego współczynnika jest więc kompromisem pomiędzy dokładnością estymacji a ryzykiem błędu.

 

W praktyce przyjmuje się zazwyczaj wartości: 0,99; 0,95 lub 0,90, zależnie od parametru.

 



Przykłady przedziałów ufności

 

Ponieważ szukamy jak najkrótszych przedziałów ufności, dlatego przy wyznaczaniu przedziału staramy się wykorzystać jak najwięcej dostępnych informacji o rozkładzie cechy w populacji. Jeśli np. cecha ma rozkład normalny z odchyleniem standardowym σ, to zastosowanie wzoru na przedział ufności dla nieznanego σ również da poprawny wynik, jednak przedział otrzymany tą metodą będzie szerszy, czyli mniej dokładny. Z kolei wzory ogólniejsze, np. dla nieznanego rozkładu, często korzystają z rozkładów granicznych estymatorów i dlatego wymagają dużej liczebności próby.

 

Przedział ufności dla wartości oczekiwanej (średniej)

Rozkład normalny

Znane odchylenie standardowe

Cecha ma w populacji rozkład normalny N(m, σ), przy czym odchylenie standardowe σ jest znane. Przedział ufności dla parametru m tego rozkładu ma postać:

 

·         \left( \overline{X} - u_{\alpha} \frac{\sigma}{\sqrt{n}}; \overline{X} + u_{\alpha} \frac{\sigma}{\sqrt{n}} \right)

·         lub równoznacznie: \left( \overline{X} - u_{\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}; \overline{X} + u_{1-\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}} \right)

gdzie:

·         n to liczebność próby losowej

·         \overline{X}oznacza średnią z próby losowej

·         s to odchylenie standardowe z próby

·         uα jest statystyką, spełniającą warunek:

P( − uα < U < uα) = 1 − α gdzie U jest zmienną losową o rozkładzie normalnym N(0, 1).

·         u_{\frac{\alpha}{2}}oraz u_{1 - \frac{\alpha}{2}}to kwantyle rzędów odpowiednio \frac{\alpha}{2}i 1 - \frac{\alpha}{2}rozkładu N(0, 1)

 

 

 

Przedział ufności dla wariancji

Poniższy wzór pozwala wyznaczyć przedział ufności dla wariancji w populacji o rozkładzie normalnym N(m, σ)

P \left( \frac{(n - 1)s^2}{\chi^{2}_{\frac{\alpha}{2}, n - 1}} < \sigma^2 < \frac{(n - 1)s^2}{\chi^{2}_{1 - \frac{\alpha}{2}, n - 1}} \right)= 1 - \alpha

gdzie:

·         n to liczebność próby losowej

·         s to odchylenie standardowe z próby

·         \chi^{2}_{\frac{\alpha}{2}, n - 1}i \chi^{2}_{1 - \frac{\alpha}{2}, n - 1}to statystyki spełniające odpowiednio równości:

P \left( \chi^2 \ge \chi^{2}_{\frac{\alpha}{2}, n - 1} \right) = \frac{\alpha}{2}

P \left( \chi^2 \ge \chi^{2}_{1 - \frac{\alpha}{2}, n - 1} \right) = 1 - \frac{\alpha}{2}

gdzie χ2 ma rozkład chi-kwadrat z n - 1 stopniami swobody

 

Minimalna liczebność próby



Jeśli chcemy oszacować parametr z określoną dokładnością d, możemy, po odpowiednich przekształceniach wzorów na przedziały ufności, wyznaczyć liczebność próby losowej potrzebną do osiągnięcia zakładanej dokładności.

Przykład: Wiemy, że wzrost Wikipedystów ma rozkład normalny z odchyleniem standardowym 25,28 cm Obliczmy ilu Wikipedystów wystarczy zmierzyć, aby z prawdopodobieństwem 95% wyznaczyć średni wzrost Wikipedysty z dokładnością do 5 cm.

Jeśli chcemy uzyskać dokładność 5 cm, należy zadbać o to, aby połowa długości przedziału ufności była mniejsza lub równa niż 5 cm. Ze wzoru na przedział ufności dla rozkładu normalnego o znanym odchyleniu standardowym wynika, że dokładność estymacji powinna spełniać zależność:

d \ge u_{\alpha} \frac{\sigma}{\sqrt{n}}

Przekształcamy podaną nierówność uzyskując pożądany wzór na liczebność próby:

n \ge \frac{u_\alpha^2 \sigma^2}{d^2}

Podstawiając do wzoru wartości σ = 25,28; d = 5 cm; uα = 1,96 (wartość obliczona na podstawie tablic rozkładu normalnego), uzyskujemy minimalną wielkość próby na poziomie 99 Wikipedystów.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

II. WERYFIKACJA HIPOTEZ STAYSTYCZNYCH



Weryfikacją hipotez nazywamy sprawdzanie sądów o populacji, sformułowanych bez zbadania jej całości. Przebieg procedury weryfikacyjnej wygląda następująco:

 

1. Sformułowanie hipotezy zerowej i alternatywnej

Hipoteza zerowa (H0) - Jest to hipoteza poddana procedurze weryfikacyjnej, w której zakładamy, że różnica między analizowanymi parametrami lub rozkładami wynosi zero. Przykładowo wnioskując o parametrach hipotezę zerową zapiszemy jako: H0: θ1 = θ2 .

Hipoteza alternatywna (H1) - hipoteza przeciwstawna do weryfikowanej. Możemy ją zapisać na trzy sposoby w zależności od sformułowania badanego problemu:

·         H1: θ1 ≠ θ2

·         H1: θ1 > θ2

·         H1: θ1 < θ2

 

2. Wybór statystyki testowej

Budujemy pewną statystykę W, która jest funkcją wyników z próby losowej W = f(x1, x2, ..., xn) i wyznaczamy jej rozkład przy założeniu, że hipoteza zerowa jest prawdziwa. Funkcję W nazywa się statystyką testową lub funkcją testową.

 

3. Określenie poziomu istotności α

Na tym etapie procedury weryfikacyjnej przyjmujemy prawdopodobieństwo popełnienia błędu I rodzaju, który polega na odrzuceniu hipotezy zerowej wtedy, gdy jest ona prawdziwa. Prawdopodobieństwo to jest oznaczane symbolem α i nazywane poziomem istotności. Na ogół przyjmujemy prawdopodobieństwo bliskie zeru, ponieważ chcemy aby ryzyko popełnienia błędu było jak najmniejsze. Najczęściej zakładamy, że poziom istotności α≤ 0.1 (np. α=0.01 ; α=0.05 ; α=0.1)

 

4. Wyznaczenie obszaru krytycznego testu

Obszar krytyczny - obszar znajdujący się zawsze na krańcach rozkładu. Jeżeli obliczona przez nas wartość statystyki testowej znajdzie się w tym obszarze to weryfikowaną przez nas hipotezę H0 odrzucamy. Wielkość obszaru krytycznego wyznacza dowolnie mały poziom istotności α, natomiast jego położenie określane jest przez hipotezę alternatywną.

Obszar krytyczny od pozostałej części rozkładu statystyki odzielony jest przez tzw. wartości krytyczne testu (wα), czyli wartości odczytane z rozkładu statystyki przy danym α, tak aby spełniona była relacja zależna od sposobu sformułowania H1:

·         P{|w|≥wα} = α    gdy H1: θ1 ≠ θ2     (obszar dwustronny)

·         P{wwα} = α    gdy H1: θ1 > θ2     (obszar prawostronny)

...

Zgłoś jeśli naruszono regulamin