Rodowód, przedmiot badań i podstawowe pojęcia statystyczne. Uwagi na temat organizacji badań stat.doc

(55 KB) Pobierz
Wprowadzenie

Wykład 1.

 

Rodowód, przedmiot badań i podstawowe pojęcia statystyczne. Uwagi na temat organizacji badań statystycznych

 

Rodowód statystyki

 

1.      badania państwowznawcze – początek spisów ludności i zasobów datuje się od bardzo dawna (np. Egipt, Chiny, 2000 lat p.n.e., Rzym 600 lat p.n.e.).

a)      arytmetycy polityczni np. J.Graunt, W.Petty, (XVII w.).

b)     tabelarystysci np. G. Achenwald (XVIIIw.) pierwszy wprowadził termin statystyka (status - państwo), J.K. Kirgiłow (opis tabelaryczny Rosji, XVIII w.), J.P. Anchersen (opis tabelarystyczny Danii, XVIII w.).

 

2.      badania zjawisk gospodarczych i społecznych, A.Quetlet (XVII-XIX w.)

a)      działalność badawcza i naukowa oparta na teorii rachunku prawdopodobieństwa:

B.Pascal (XVII w.), P.Fermat (XVII w.), A. de Moivre, (XVIII w.), P.C. Laplace (XIX w.), K.F. Gauss (XIX w.), S.Poisson (XIX w.).

b)     podejmowanie decyzji diagnostycznych w warunkach niepewności: K. Pearson, R.A. Fisher, J.Neyman, E.S.Pearson, A. Wald (XX w.)

 

Statystyka – nauka traktująca o ilościowych metodach badania zjawisk (procesów) masowych.

 

Metody statystyczne obejmują:

a)      deterministyczne metody opisowe (statystyka opisowa).

b)     wnioskowanie statystyczne (metody uogólniania wyników otrzymanych z próby losowej na całą populację).

 

Zadania statystyki

a)        opis zjawiska masowego (procesu masowego)

b)        wykrycie prawidłowości jakie w tych zjawiskach istnieją

 

Podstawowe pojęcia statystyczne:

 

1.      Zbiorowość statystyczna (populacja, masa statystyczna) – zbiór dowolnych elementów objętych badaniem statystycznym. Elementy składowe badanej zbiorowości nazywamy jednostkami statystycznymi.

2.      Cecha statystyczna – właściwości jednostek zbiorowości statystycznych. Cechy statystyczne dzielą się na stałe i zmienne. Badaniom statystycznym podlegają cechy zmienne.

Cechy:

a)      jakościowe (niemierzalne – nie da się ich zmierzyć, lecz tylko określić słownie np. rodzaj badanej skały, gatunek drzewa w lesie).

b)     ilościowe (mierzalne).

-          quasi-ilościowe (określa natężenie badanej właściwości w sposób opisowy np. stopień zachmurzenia nieba w prognozach pogody).

-          skokowe (liczba przekroczeń stanu alarmowego rzeki w ciągu roku).

-          ciągłe (np. temperatura, ciśnienie, objętość, masa).

 

W praktyce zdarza się często  że podział cech na skokowe i ciągłe nie jest ostry.

 

Gdy cechy statystyczne mają dwa różne warianty to mówimy, że podział jest dychotomiczny: np. cecha: zawartość danego związku chemicznego  w glebie  może być naturalna bądź pochodzenia antropogenicznego.

 

Rodzaje badań statystycznych

 

Badania mogą być:

1.       

a)      pełne (całkowite, wyczerpujące)  - obejmujące wszystkie jednostki zbiorowości statystycznej.

b)     niepełne (częściowe) obejmujące niektóre jednostki zbiorowości statystycznej.

c)      szacunki interpolacyjne lub ekstrapolacyjne.

(Interpolacja – szacowanie nieznanych wartości cechy na podstawie znanych wartości sąsiednich).

(Ekstrapolacja – szacowanie wartości wykraczających poza przedział znanych wartości).

2.       

a)      ciągłe

b)     okresowe

c)      doraźne

 

3.      rodzaje badań niepełnych

 

a)      ankietowe

b)     monograficzne (szczegółowy i wszechstronny opis jednej, typowej jednostki statystycznej (lub ich niewielkiej ilości).

c)      reprezentacyjne ( częściowe badanie statystyczne oparte na próbie pobranej ze zbiorowości generalnej w sposób losowy).

 

 

Etapy badań statystycznych (zarys):

 

1)     przygotowanie (programowanie) badania:

Badanie statystyczne powinno być podporządkowane konkretnemu celowi.

Należy dokładnie określić przedmiot badania tzn. jednostkę badania i zbiorowość statystyczną. Należy podjąć decyzję co do metody badania (pełne czy niepełne).

 

2)     obserwacja statystyczna – polega na ustaleniu wartości cech ilościowych lub odmian cech jakościowych u wszystkich jednostek tworzących zbiorowość statystyczną. Odbywa się drogą bezpośredniego pomiaru lub zbierania informacji. Zbiór danych uzyskanych w wyniku obserwacji nazywamy materiałem statystycznym.

Materiał statystyczny powinien być poddany kontroli pod względem możliwych błędów. Kontrola jest dwojakiego rodzaju:

a)      formalna (ilościowa) polega na sprawdzeniu kompletności, pełności i zupełności materiału statystycznego

b)     merytoryczna – obejmuje kontrolę logiczną i arytmetyczną.

 

Błędy występujące w materiale statystycznym mogą być:

a)      systematyczne (tendencyjne) –wynikają z jednokierunkowej tendencji do zniekształcania badanej rzeczywistości. Błędy systematyczne sumują się.

b)     niesystematyczne (przypadkowe) – są popełniane nieumyślnie np. z nieuwagi, przez pomyłkę itp.

 

3)     opracowanie i prezentacja materiału statystycznego

a)      grupowanie – polega na wyodrębnieniu jednorodnych lub względnie jednorodnych części w ramach większej i zróżnicowanej zbiorowości statystycznej. Statystyka nie podaje sztywnych reguł dotyczących grupowania. Zaleca się jednak stosowanie dwóch kryteriów:

-          jednostki zaliczane do tej samej grupy nie powinny być zbyt zróżnicowane.

-          liczba grup nie powinna być zbyt duża.

Dzielenie materiału statystycznego ze względu na jedną cechę nazywamy grupowaniem prostym.

Dzielenie materiału statystycznego na podstawie kilku cech nazywamy grupowaniem złożonym.

 

Jednolity system grupowania nazywamy klasyfikacją.

 

Z punktu widzenia celu grupowanie dzielimy na:

 

- typologiczne – polega na wyodrębnianiu grup na podstawie wariantów cech jakościowych.

- wariacyjne  - oparte się na cechach ilościowych.

 

b)     zliczanie.

 

Niezwykle ważna jest prezentacja materiału statystycznego.

 

Materiał ten prezentujemy przy pomocy tzw. szeregów statystycznych.

 

Szeregi statystyczne mogą być przedstawiane w różnorodnej postaci np. w formie tabelarycznej, wykresów, histogramów.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Rodzaje szeregów statystycznych

 

 

Szereg szczegółowy – materiał statystyczny uporządkowany wyłącznie według wartości badanej cechy (w kolejności malejącej lub niemalejącej). Np. temperatura w południe w danej miejscowości w danym tygodniu: 12,5; 13,1; 14,3; 14,4; 15,1;16,5; 17,7.

 

Szereg rozdzielczy –zbiór wartości liczbowych uporządkowanych według wariantów cechy mierzalnej lub niemierzalnej. Poszczególnym wariantom przyporządkowane są odpowiadające im liczebności. Szeregi rozdzielcze dzielimy na punktowe (w przypadku cechy skokowej) lub przedziałowe (w przypadku cechy ciągłej lub punktowej).

 

Przykład szeregu rozdzielczego punktowego, wybrane cechy: województwo oraz liczba pomiarów zanieczyszczenia gleby daną substancją.

 

Województwo
Liczba pomiarów

Mazowieckie

500

Lubuskie

112

Dolnośląskie

366

Kujawsko-Pomorskie

405

Małopolskie

239

.......

.......

 

 

Przykład szeregu rozdzielczego przedziałowego, wybrana cecha – zanieczyszczenie gleby (w ppm).

 

Zanieczyszczenie gleby (w ppm)

Liczba pomiarów na danym obszarze

Od 0 do 40

39

40-60

4

60-80

8

80-100

3

ponad 100

1

 

Budując szeregi rozdzielcze musimy zadecydować o:

a)      liczbie przedziałów klasowych

b)     ich rozpiętości

c)      sposobie określenia granic przedziałów

 

Niektóre sugestie literaturowe na temat liczby przedziałów:

 

-              liczba przedziałów (k) powinna mieścić się w granicach 15-25 (nie mniej niż 10. (Yule i Kendall)

-          liczba przedziałów powinna mieścić się w granicach 10-20 (S. Szulc)

-          inne sugestie

:             





(N oznacza liczebność grupy)

Najlepszym przewodnikiem jest jednak zdrowy rozsądek i znajomość celu, któremu ma służyć podział zbiorowości na klasy.

 

Rozpiętość przedziału i (interwał, rozstęp) obliczamy ze wzoru:

 

 



gdzie i-interwał przedziałowy, xmax – największa wartość cechy, xmin – najmniejsza wartość cechy, k – liczba przedziałów.

 

4)     opis lub wnioskowanie statystyczne  (uwagi).

a)...

Zgłoś jeśli naruszono regulamin