Kiniuś™
Statystyka
Dr Elżbieta Grabowska
(notatki z wykładu)
01.03.2009
Statystyka to nauka o opracowywaniu danych masowych.
2 podstawowe działy:
1. Opis statystyczny – służy do charakterystyki badania danej próby (grupy) obiektów i realizowany jest za pomocą wskaźników statystycznych. (np. średnia grupy)
2. Wnioskowanie statystyczne – polega na stosowaniu testów statystycznych i służy do ustalenia prawdopodobieństwa z jakim na podstawie wyników próby można wyciągnąć wnioski o całej populacji.
Populacja – każda dowolna zbiorowość, względnie jednorodnych elementów tzn. mających minimum jedną wspólną cechę. Np.
- populacja Polaków uprawnionych do głosowania
- populacja studentów WSFiZ
- populacja narkomanów narkomanów w Warszawie
- populacja przedszkolaków niepełnosprawnych w bieżącym roku w dzielnicy Warszawa śródmieście
Populacja skończona – populacja o skończonej liczbie jednostek np. populacja studentów WSFiZ (według listy)
Populacja otwarta – nieograniczona określoną liczbą np. populacja narkomanów narkomanów Warszawie
Próba – konkretna część populacji, która podlega obserwacji lub pomiarowi. Próba ma zawsze określoną liczebność.
Strategie badawcze:
1. Strategia badań wyczerpujących (prostych) badamy wszystkich, próba jest jednocześnie populacją. Otrzymane wnioski są 100% pewne, ponieważ zbadaliśmy całą populację. Opracowanie statystyczne kończymy na opisie danych.
2. Strategia badań reprezentatywnych w określonej populacji losujemy próbę. Badanie przeprowadzamy na próbie, dokonujemy jej opisu a następnie za pomocą odpowiednio dobranego testu ustalamy prawdopodobieństwo, z jakim uzyskane dane można odnieść do całej populacji. Wyniki zawsze są prawdopodobne nigdy 100% pewne.
Próba tendencyjna - dane uzyskane z próby tendencyjnej ( nie losowej) są bez wartości dla wnioskowania o populacji. Badania na takiej grupie dają przekłamania w wynikach. ( np. badanie samych prymusów w liceum pod kątem stosunku do szkoły nie będzie prawdziwe dla całej populacji tego liceum)
Próba reprezentacyjna – losowo wybrani reprezentanci populacji. Wyniki prawdopodobne.
Próba okazjonalna - grupa, która jest dla nas najłatwiej dostępna. Wyniki mogą być prawdopodobne, mogą być przekłamane.
! Próba reprezentatywna – wylosowana z całej populacji, która dobrze odzwierciedla całą populację, czyli jej właściwości, jest dobrym modułem.
Sposoby pobierania próby reprezentatywnej:
1. Losowanie proste:
Ustalamy sposób losowania, czyli listę obiektów stanowiącą populację, ustalamy sposób losowania np:
- z urny, lub z kapelusza
- użycie maszyny losującej
- użycie tablic liczb losowych
- użycie komputerowego programu losującego
- losowanie grupowe (losuje się grupy, np. klasy a nie pojedynczych uczniów)
- pobór systematyczny (bierze się, co którąś osobę populacji wg. np. listy)
Powyższe sposoby losowania prostego są wystarczające, jeżeli populacja jest względnie jednorodna, gdy populacja jest niejednorodna (tzn. występują w niej wyraźnie odrębne podgrupy) wtedy zalecane jest losowanie warstwowe albo warstwowo – kwotowe.
2. Losowanie warstwowe:
1. Ustalamy podgrupy (warstwy) istniejące w danej populacji
2. Szacujemy ich wielkość (np. czy są jednakowej wielkości, czy jest tylko samo kobiet co mężczyzn itd.).
3. Przeprowadzamy losowanie proste w obrębie każdej warstwy z osobna.
3. Losowanie kwotowe:
np. badania są wykonywane na jakimś procencie danej populacji.
Tryb studiów
Liczba studentów
10% populacji do badania
Dzienne
651
65
Zaoczne
2576
257
Wieczorowe
1986
198
4. Losowanie gronowe:
W poważnych badaniach ogólnopolskich socjologicznych i ekonomiczno – społecznych, stosuje się losowanie gronowe.
1. z populacji losuje się grona
2. z gron losuje się warstwy
3. w warstwach – losowanie proste.
Cecha (zmienna) - każda dowolna właściwość, która będzie obserwowana lub mierzona w próbie.
4 skale pomiarowe: (od najmniej zaawansowanej)
1. Skala Nominalna– odnosi się do takich cech jakościowych jak:
płeć, typ motywacji, rodzaj wykształcenia, marka produktu, rasa psa, kota…
Pomiar polega na klasyfikacji na kategorie. Zalecane jest, aby klasyfikacja była zupełna i rozłączna (dopuszczalna jest klasyfikacja nierozłączna).
Klasyfikacja zupełna – wszyscy z próby są sklasyfikowani
Klasyfikacja rozłączna – każdy obiekt może być przydzielony tylko raz, do tylko jednej kategorii.
Klasyfikacja nierozłączna – każdy obiekt może należeć do kilku kategorii.
! Każda sytuacja, w której nie jest zachowana klasyfikacja zupełna i rozłączna, oraz brakuje odpowiedniej interpretacji, grozi bardzo poważnym zafałszowaniem danych.
2. Skala Porządkowa (porządkująca) – odnosi się do takich cech jak: miejsce na mecie maratonu, miejsce w kolejce, poziom asertywności, stopień lęku przed egzaminem, poziom bałaganu we własnej szafie
Operacją pomiarową jest rangowanie, czyli numerowanie wszystkich obiektów z próby ze względu na nasilenie cechy.
Rangowanie zupełne (silne) – gdy kolejnym obiektom w szeregu przypisujemy jako rangi kolejne liczby całkowite. (każdy ma 1 miejsce)
Rangowanie niezupełne (słabe) - gdy powstają węzły rang, czyli podgrupy osób (obiektów) z jednakowym nasileniem cechy. (kilka osób ma to samo miejsce)
Wszystkie cechy porządkowe możemy podzielić na:
Stymulanty – większe nasilenie cechy jest wartościowane pozytywnie np. uroda, poziom zdolności twórczych.
Destymulanty – mniejsze nasilenie cechy jest wartościowane pozytywnie np. poziom spróchnienia zębów, poziom złośliwości.
Dominanty – środkowe nasilenie cechy jest wartościowane pozytywnie np. poziom opiekuńczości wobec dziecka, poziom zadbania o własne interesy.
3. Skala Interwałowa (przedziałowa) – odnosi się do cech: liczba punktów z testów, kwestionariuszy, zawodów; iloraz inteligencji; temperatura °C i °F; czas liczony w wiekach od narodzenia Chrystusa.
Jest to pomiar ilościowy, liczony od zera umownego, z dokładnością do stałego przekształcenia liniowego (są równe przedziały) w efekcie możemy powiedzieć o ile jednostek jeden pomiar jest większy od drugiego, ale nie ma sensu ustalanie ile razy jest większy.
4. Skala Stosunkowa (ilorazowa) – odnosi się do takich cech jak: czas, długość w dowolnych jednostkach; cena; liczba powtórzeń; praktycznie wszystkie pomiary fizyczne.
Pomiar jest ilościowy (zawsze jest precyzyjnie ustalona liczba pomiaru). Pomiar dokonywany jest od zera naturalnego z dokładnością do stałości ilorazu ( możemy ustalić zarówno za równo o ile i ile razy jeden pomiar jest większy od drugiego).
Każdy pomiar wyrażony na skali wyższego rzędu, da się przekształcić na dowolny poziom niższego rzędu (każdy pomiar możemy z nominalizować). Zmiana każdego pomiaru na skalę nominalną nazywa się nominalizacją. (np.wzrost w cm możemy znominalizować do wysoki, średni, niski)
! Nie można przejść od pomiaru z niższej skali do wyżej.
Wybór skali zależy zarówno od badacza jak i od cechy.
Każdy pomiar ilościowy wyrażony w skali interwałowej i stosunkowej może być:
1.Skokowy np. liczba posiadanych dzieci, liczba wizyt u dentysty w roku.
( 0 dzieci, 1 dziecko, 2 dzieci itd.)
2.W przybliżeniu ciągły np. punkty, cena, wzrost czy waga człowieka dorosłego.
3.Ciągły np. czas, długość gdzie możliwy jest dokładny pomiar do miejsc po przecinku, wyniki mogą być dowolnie rozłożone między maksimum a minimum nasilenia cechy.
Zasady prezentacji rozkładu wyników z poszczególnych skal:
kategoria
a
b
c
Liczba os.
123
47
30
%
61%
24%
15%
1. Nominalna
- klasyfikujemy w tabeli
lub
- wykres kołowy
- wykres słupkowy
! Dane sklasyfikowane nierozłącznie, można przedstawić tylko na wykresie słupkowym.
2. Porządkowa
...
dida1979