struktura zbiorowości.doc

(427 KB) Pobierz

5. WYMIEŃ I WYJAŚNIJ OPISOWE CHARAKTERYSTYKI ROZKŁADÓW:

 

1. MIARY ŚREDNIE;

2. MIARY ZMIENNOŚCI;

3. MIARY ASYMETRII;

4. MIARY KONCENTRACJI;

 

1. MIARY ŚREDNIE

 

W każdym z podanych wyżej typów miar występują miary klasyczne, których wartości obliczamy na podstawie wszystkich wartości cechy oraz miary pozycyjne, których wartości wyznaczane są przez wykaz wartości najczęściej występującej lub przez podział uporządkowanego nie malejąco ciągu wartości cechy na części równe pod względem liczebności.

 

Do klasycznych miar położenia zaliczamy średnią arytmetyczną. Pozycyjne miary położenia to dominanta (D, Mo), mediana (Me), kwartale (Q).

Średnia arytmetyczna

Dominanta, Mediana, kwartyle





Pozycyjne miary położenia

 

 

 

 

Średnia arytmetyczna jest najczęściej stosowaną klasyczną miarą położenia. W zależności od typu szeregu określają ją wzory.

 

Dla szeregów rozdzielczych- jednojednostkowego.

==

 

We wzorze dla szeregu rozdzielczego z przedziałami klasowymi oznacza środek przedziału klasowego. Średnią arytmetyczną obliczamy w zasadzie dla szeregów o zamkniętych przedziałach skrajnych. W przypadku gdy skrajne przedziały są otwarte i liczebność na nich jest niewielka, można je sztucznie domknąć i obliczyć wartość średniej arytmetycznej. Oczywiście w sytuacji, gdy liczebność przedziałów otwartych jest znacznie skrajna nie obliczamy średniej arytmetycznej.

 

Własności średniej arytmetycznej:

 

1 średnia arytmetyczna wyraża się w takich samych jednostkach jak wartości badanej cechy.

2 wartość średniej arytmetycznej zawiera się między najmniejszą a największą z wartości dla których ją obliczamy.

3 średnia arytmetyczna jest miarą wrażliwą na skrajne wartości cechy zatem dobrze charakteryzuje przeciętny poziom wartości cechy w zbiorowości o niewielkim stopniu zróżnicowania.

4 suma odchyleń poszczególnych wartości cechy od średniej arytmetycznej jest równa 0, tzw. Dla szeregu prostego.

Dla szeregów rozdzielczych:
 

5. suma kwadratów odchyleń wartości cechy od stałej jest najmniejszą, gdy za stałą przyjmujemy średnią arytmetyczną.

 

Min c  =; min c

Następna średnia arytmetyczna to dominanta, inaczej moda, inaczej modalna. Dla szeregu szczegółowego i szeregu rozdzielczego punktowego jest to wartość cechy, która w danym szeregu występuje najczęściej o ile, nie jest to wartość skrajna. Dominantę wyznaczamy wówczas w sposób przybliżony korzystając z następującego wzoru:

Mo=D=xo+

Xo- dolna granica przedziału dominanty

No- liczebność przedziału dominanty

n-1- liczebność przedziału poprzedzającego przedział dominanty

n+1- liczebność przedziału następującego po przedziale dominanty

ho-rozpiętość przedziału dominanty

 

Dla szeregu z przedziałami klasowymi o istnieniu dominanty mówimy wówczas gdy istnieje przedział o wyraźnie większej od innych liczebności i nie jest to przedział skrajny. Dominantę w szeregu z przedziałami klasowymi możemy wyznaczyć nawet gdy skrajne przedziały są otwarte, jednak rozpiętość pozostałych przedziałów powinna być w przybliżeniu jednakowa.

 

Właściwości dominanty:

 

1. dominanta wyraża się w takich samych jednostkach jak wartości badanej cechy.

2. wartość dominanty zawiera się między najmniejszą a największą wartością cechy.

3. dominanta jest miarą niewrażliwą na skrajne wartości cechy.

 

W interpretacji dominanty podajemy, że jest to wartość, którą ma najliczniejsza grupa jednostek podkreślając dla szeregów z przedziałami klasowymi, że jest to wartość przybliżona.

 

Kwantyle są to takie wartości, które dzielą uporządkowany niemalejąco ciąg wartości cechy na części równe pod względem liczebności. Mówiąc że kwanty jest rzędu n-tego rozumiemy że zbiorowość podzielona została na n- równych części. Do najczęściej stosowanych kwantyli należą:

1. mediana, czyli kwartyl rzędu drugiego dzieląca zbiorowość na dwie równe części i nazywane często wartością środkową.

2. kwartyle, czyli kwantyle rzędu czwartego dzielące zbiorowość na cztery równe części.

3. kwintyle, czyli kwartale rzędu czwartego dzielącego zbiorowość na 5 części.

4. decyle dzielące zbiorowość na 10 części.

5. centyle dzielące na 100 części. Stosowane do bardzo licznych zbiorowości.

 

Mediana jest jednocześnie drugim kwartylem, piątym decylem, pięćdziesiątym centylem. Dla szeregów punktowych, szczegółowego i punktowego medianę wyznaczamy w następujący sposób:

1. gdy n jest liczbą nieparzystą wówczas medianą jest element o numerze

2. gdy n jest liczbą parzystą, medianą jest średnia arytmetyczna dwóch środkowych elementów Me=(x

Kwartyl pierwszy (dolny) Q1 dla szeregów punktowych szczegółowego i rozdzielczego wyznaczamy biorąc pod uwagę elementy szeregu stojące przed medianą, a dla n nieparzystych łącznie z tą medianą i wyznaczamy tak jakby był medianą dla tej części szeregu.

 

Kwartyl trzeci (górny) Q3 wyznaczamy w szeregach punktowych biorąc pod uwagę elementy szeregu stojące za medianą a dla n nieparzystych łącznie z tą medianą i wyznaczamy, go tak jakby był medianą dla tej części szeregu. Q2=Me

 

Przy wyznaczaniu kwartyli dla szeregów rozdzielczych punktowych z przedziałami klasowymi stosuje się liczebność skumulowaną. Dla szeregów z przedziałami klasowymi kwartale wyznacza się w sposób przybliżony. Mediana dla szeregów z przedziałami klasowymi: Me=xo+ho/no(NMe-ns-1), w którym NMe=n/2- numer mediany; ns-1-liczebność skumulowana.

 

Najpierw wyznaczamy numer odpowiedniego kwartyla dla mediany NMe=n/2, dla kwartyla pierwszego NQ1=n/4, dla kwartyla trzeciego NQ3=3n/4;

Następnie w szeregu liczebności skumulowanej odnajdujemy miejsce wyznaczonych numerów i w ten sposób mamy wybrany przedział mediany, przedział kwargla 1i3.  Do tych przedziałów odnoszą się oznaczenia występujące we wzorach określających te miary. Oznaczenia te mają jednakowy sens dla każdego kwartyla. Numery kwarty li: NQ1=n/4;

NQ3=3n/4; Q1=xo+ho/no(NQ1-ns-1);Q3=xo+ho/no(NQ3-ns-1);

 

Mediana: pozostałe kwartyle można wyznaczyć dla każdego szeregu, zatem są to bardzo ważne miary dla tych szeregów, w których nie istnieje dominanta lub nie można obliczyć średniej arytmetycznej. W takiej sytuacji mediana informuje o tym, że 50% jednostek ma wartości większe niż mediana i 50% nie mniejsze niż mediana.

 

Własności kwarty li:

 

1. kwartyle wyrażają się w takich samych jednostkach w jakich występują wartości cechy.

2. są to miary nie wrażliwe na skrajne wartości cechy, zatem mediana znajduję zastosowanie jako miara przeciętnego poziomu zjawiska w szeregu, w którym wystąpiła nietypowa wartość cechy.

3. kwartyle spełniają warunek X min≤Q1≤Me≤Q3≤Q max

4. kwartyl pierwszy i trzeci wyznaczają zbiór wartości cechy dla 50% środkowych jednostek.

 

 

2. MIARY ZMIENNOŚCI (ZRÓŻNICOWANIA, DYSPERSJI, ROZPROSZENIA)

 

Drugą obok miar położenia grupą miar charakteryzujących zastosowanie cechy mierzalnej w zbiorowości statystycznej stanowią miary zmienności. Przy ich pomocy oceniamy zróżnicowanie jednostek ze względu na badaną cechę. Miary te pozwalają również na ocenę wartości poznawczej miar średnich. Im mniejsze zróżnicowanie tym wyższa jest wartość poznawcza miar średnich. Siłę dyspersji można oceniać przy pomocy miar klasycznych i pozycyjnych.

 

Pozycyjne miary zmienności to rozstęp szeregu R.

1. Odchylenie kwartylowe (ćwiartkowe Q)- jest to ważna miara zmienności zwłaszcza dla tych szeregów, w których nie można wyznaczyć miar klasycznych. Mierzy zróżnicowanie tylko dla wartości cechy zawartych między kwartylami.

2. Pozycyjny współczynnik zmienności (ws20; ws21);

Q==

Współczynnik zmienności odgrywają znaczną rolę w dwóch sytuacjach:

1. Gdy chcemy porównać zróżnicowanie jednej zbiorowości ze względu na kilka badanych w niej cech.

2. Gdy chcemy porównać zróżnicowanie kilku zbiorowości badanych ze względu na tę samą cechę.

 

Do klasycznych miar zmienności zaliczamy:

1. odchylenie standardowe ᵹ(delta) albo (s- dla próby);

2. odchylenie przeciętne d

3. klasyczne współczynniki zmienności Vᵹ, Vd

V=*100; Vd=*100

Najprostszą miarą zmienności jest rozstęp szeregu. R=Xmax-Xmin

 

Miara ta wyraża się w takich samych jednostkach w jakich występują wartości cechy. Dla szeregów z przedziałami klasowymi rozstęp możemy wyznaczyć tylko w przybliżeniu.

 

Własności zdefiniowanych odchyleń:

 

1 Odchylenie kwartylowe, standardowe i przeciętne są miarami mianowanymi wyrażają się w takich samych jednostkach jak wartości badanej cechy.

2 Odchylenie standardowe i przeciętne to miary wrażliwe na skrajne wartości cechy. Odchylenie kwartylowe nie jest wrażliwe na skrajne wartości cechy.

3 Jeżeli wyznaczamy odchylenie kwartylowe, przeciętne i standardowe to miary te spełniają warunek: Q≤Q≤d≤ᵹ

 

3. MIARY ASYMETRII (SKOŚNOŚCI)

 

Badając interesującą nas zbiorowość ze względu na cechę mierzalną chcemy często wiedzieć czy w danej zbiorowości znacząco ze statystycznego punktu widzenia liczba jednostek ma wartości cechy poniżej czy powyżej średniej arytmetycznej. Odpowiedz na to pytanie uzyskamy badając asymetrię (skośności) rozkładu. Z punktu widzenia asymetrii wyróżniamy następujące typy szeregów statystycznych:

 

1. szereg statystyczny to taki, w którym średnia= medianie= modzie(dominanta),

2. szereg asymetrii prawostronnej. Przy tym szeregu najliczniejsza grupa jednostek ma wartości cechy mniejsze niż średnia arytmetyczna.

 

Szereg asymetrii lewostronnej, w którym najliczniejsza grupa jednostek ma wartości poniżej średniej arytmetycznej. Miarą pozwalającą na ocenę kierunku asymetrii jest wskaźnik skośności; ws22, ws= x-Mo. Jest on równy 0 dla rozkładów symetrycznych, dodatni dla rozkładów o asymetrii prawostronnej, ujemny dla rozkładów o asymetrii lewostronnej.

 

Zarówno kierunek jak i siłę asymetrii oceniamy obliczając współczynnik skośności.

Aᵹ(delta)= As=, Ad=

Współczynniki te przyjmują w zasadzie wartość z przedziału: -1;1, ale przy bardzo silnej asymetrii mogą wykraczać poza ten przedział. W sytuacji gdy nie dysponujemy miarami klasycznymi ocenę asymetrii możemy uzyskać stosując pozycyjny wskaźnik skośności:

AQ=

Współczynnik ten określa tylko asymetrię jednostek zawartych między kwartylami i przyjmuję również wartości z przedziału (-1;1).

 

4. MIARY KONCENTRACJI

 

Zjawisko koncentracji może być rozważane jako nierównomierny podział ogólnej sumy wartości cechy pomiędzy poszczególne jednostki badanej zbiorowości.

 

Do oceny stopnia koncentracji stosujemy dwie metody.

 

1. Metoda numeryczna – wyznaczanie odpowiednich wskaźników liczbowych (współczynnik skupienia inaczej kurtoza, współczynnik koncentracji Lorenza).

2. Metoda graficzna – wykreślanie i analiza tzw. Krzywej koncentracji Lorenza.

 

WSPÓŁCZYNNIK SKUPIENIA (KURTOZA)

 

K=

gdzie: s – odchylenie standardowe

 

Kurtoza (K) należy do klasycznych miar koncentracji.

Im większa wartość kurtozy (K), tym większa koncentracja

 

KRZYWA KONCENTRACJI LORENZA

 

Dane pogrupowane są w szereg rozdzielczy przedziałowy.

 

Krzywą koncentracji Lorenza rysujemy wykorzystując:

 

* skumulowaną częstość dla liczebności (wi sk) oraz

* skumulowaną częstość dla wartości cechy (zi sk);

 

wartość cechy obliczamy w każdej klasie jako iloczyn ni zi. Obie częstości wyrażamy w % .

 

Krzywą Lorenza otrzymujemy nanosząc na powyższym wykresie dla każdej klasy punkt o współrzędnych (wi sk ,zi sk). Następnie łączymy te punkty odcinkami. Punkt (w1 sk ,z1 sk)

łączymy dodatkowo z punktem (0 , 0

Im większa jest powierzchnia pola (a), tym większa jest koncentracja w badanym zjawisku.

 

WSPÓŁCZYNNIK KONCENTRACJI LORENZA (KL)

 

Aby liczbowo wyrazić wielkość koncentracji wyliczamy tzw. współczynnik koncentracji Lorenza (KL). Jest on równy stosunkowi pola (a) do pola powierzchni połowy kwadratu (5000):

KL=

 

 

Ponieważ łatwiej jest policzyć pole (b), to pole (a) wyznaczamy z żnicy a=5000-b.

Pole (b) jest sumąl trapezów prostokątnych.

 

 

 



 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ostateczny wzór na współczynnik koncentracji Lorenza (KL) ma postać:

KL=-=1-

KL - 1 oznacza silną koncentrację

KL -0 oznacza słabą koncentrację

Zgłoś jeśli naruszono regulamin