czwartek, 1 sierpnia 2013

Statystyka opisowa - 3

Zjawisko masowe-wydobycie węgla, student
Przedmiotem badań statystycznych są zbiorowości statystyczne (populacja statystyczna) które są zbiorami pewnych elementów nazywane jednostkami statystycznymi. Przez badanie statystyczne rozumiemy ogól prac mających na celu poznanie określonej zbiorowości statystycznej

Wyróżniamy 4 etapy badań
I) przygotowanie badania  
Zbiorowość i jednostka powinny być precyzyjnie określone pod względem: *rzeczowym(co i kogo badamy)   *przestrzennym(gdzie się odbywa)    czasowym (kiedy jaki okres jest objęty badaniem lub w jakiej chwili się odbywa)      
4)Skala pomiarowa   -nominalna(kolor oczu wyznanie religijne pleć)    -porządkowa(wykształcenie)    -przedziałowa(skala temperatur)   -ilorazowa      5)wybór metody badania statystycznego  -badanie całkowite(badamy calą zbiorowość)   -badanie częściowe(gdy badamy część zbiorowości-próba)

III) Opracowanie materiału statyst. I jego prezentowanie
a)grupowanie   -typologiczne polega na wyodrębnianiu jednorodnych grup na podstawie wariantów cech jakościowych   -wariancyjne opiera się na cechach ilościowych     b)zliczanie    
IV) Analiza wyników opracowania         

      

PARAMETRY OPISUJĄCE STRUKTURĘ ZBIOROWOŚCI STATYS.

1 Wskaźnik struktury- to stosunek części zbiorowości wyróżniającej się wariantem lub wartością cechy do całej zbiorowości  wi=ni/n
2.Wskaźnik natężenia –jest to wielkość stosunkowa wyrażająca kształtowanie się wielkości jednego zjawiska na tle drugiego logicznie z tym związanego  wN=mi/ni

3.Miary opisujące tendencje centralną
klasyczne
a)średnia arytmetyczna
Własności    -jest wypadkową wszystkich wartości zmiennej i spalania nierówność x   <x<x       -wartość średniej arytmetycznej nie zależy od liczebności klas lecz od ich wzajemnych proporcji tzn zamiast liczebności można stosować wskaźniki struktury  x=?xi*wi      -suma odchyleń poszczególnych wartości zmiennej od średniej arytmetycznej jest równa 0 czyli ?(xi-x)=0
Średnia arytmetyczna jest miarą prawidłową tylko w odniesieniu d
o zbiorowości jednorodnych o niewielkim zróżnicowaniu rozkładu a także w rozkładach biomodalnych i wielomodalnych średnia arytmetyczna traci wartość poznawczą.  
Średnia arytm. nie można obliczyć dla szeregu o otwartych przedziałach jeśli przedziały te mają duże liczebności. Umownie przyjmuje się bowiem że otwarte przedziały klasowe można zamykać wówczas gdy liczba jednostek w tych przedziałach nie przekracza 5% liczebności całej populacji      
b)średnia harmoniczna stosujemy ją wtedy gdy mamy do czynienia z cechami stosunkowymi tzn gdy jedna wielkość jest dzielona przez drugą np.prędkość,gęstość zaludnienia,przeciętne ceny towarów,przeciętna szybkość obrotów pieniężnych
c) średnia geometryczna jest pierwiastkiem n-tego stopnia z iloczynu n wartości danej zmiennej. Obliczamy ją wtedy gdy mamy do czynienia z szeregiem którego wartości są bardziej zróżnicowane ponieważ jest ona mniej wrażliwa od średniej arytmetycznej na wartości nietypowe
Średnia geometr. Znajduje zastosowanie przy badaniu średniego tempa zmian zjawisk

Pozycyjne
a)dominanta(D modalna,moda) –jest to ta wartość która występuje najczęściej.
założenia:-jeden przedział musi być wyraźnie dominujący      -rozpiętość tego przedziału i przedziałów sąsiednich musi być jednakowa
Własności:  -wyznaczamy ją wtedy i tylko wtedy gdy jest 1 ośrodek dominujący w przeciwnym wypadku mówimy o szeregach wielomadalnych       -jeżeli w szeregu rozdzielczym z przedziałami klasowymi dominanta występuje w skrajnych przedziałach wówczas nie wyznaczamy jej analitycznie     -wartość dominanty nie zmieni się gdy do wzoru zamiast liczebności wstawiamy częstość

c)kwantyle
*mediana – to wartość która w uporządkowanym szeregu statys. zajmuje pozycje środkową
Własności:  -wartość mediany nie zależy od wartości krańcowych w przeciwieństwie do średniej arytm. jest więc średnią odporną na wartości nietypowe      -można ją wyznaczyć we wszystkich rodzajach szeregów statys. Jest często stosowane w doświadczalnictwie, mikrobiologi      -medianę można wyznaczyć gdy liczebności wszystkich przedziałów nie są dokładnie znane wystarczy że znamy liczbę wszystkich obserwacji i wartość środkową

kwartyl pierwszy(Q1) jest to wartość cechy poniżej której znajduje się 1/4 zbiorowości a powyżej 3/4 zbiorowości
*kwintyle(dzielą zbiorowość na 5 części)        *decyle(dzielą zbiorowość na 10 części)      *percentyle(dzielą zbiorowość na 100 części)

4. Miary dyspersji (rozproszenia, zróżnicowania, rozrzutu)
5.Miary asymetrii
6. Miary koncentracji

Współczynnik korelacji - służy do opisu siły korelacji dwóch cech w przypadku, gdy cechy są mierzalne, a badana zbiorowość jest nieliczna, gdy mają one charakter jakościowy i istnieje możliwość ich porządkowania

Współczynnik korelacji rang wyznacza się ze wzoru
 Gdzie:
-di oznaczają różnice miedzy rangami odpowiadających sobie wartości cechy xi i yi
Współczynnik korelacji rang przyjmuje wartości przedziału (-1:1) i jego interpretacja jest identyczna jak współczynnik korelacji Persona.

ANALIZA REGRESJI- jest bardzo ważną metodą często stosowaną w ekonometrii i zarządzaniu. Operuje ona modelem statystycznym.

Model statystyczny- zbiór matematycznych wzorów i założeń, które opisują pewną sytuację zachodzącą w swiecie rzeczywistym. 

Prosty model regresji liniowej: Y= Bo + B1X + E, gdzie
-Bo- parametr przecięcia(wyraz wolny)
-B1- parametr nachylenia(współczynnik kierunkowy)
-E- błąd losowy
-X- zmienna objasniająca(niezależna)
-Y- zmienna objaśniana(zależna)

Model ten ma zastosowanie gdy związek miedzy zmiennymi x i y maja związek liniowy.
Oszacowanie parametrów dokonujemy metodą najmniejszych kwadratów w której ideą jest to by dobrać takie oszacowania parametru by dla wylosowanej próby suma kwadratów różnic pomiedzy empirycznymi wartościami zmiennej y a wartościami przewidywanymi krzywej regresji była najmniejsza.

Bezwzględna wartość współczynnika regresji informuje nas jak zmieni się poziom zmiennej zależnej przy wzroście zmiennej nie zależnej o jednostkę. Znak nam informuje o kierunku zależności (+) zależność dodatnia, wzrost jednej cechy powoduje wzrost drugiej. (-) zależność ujemna.

Dopasowanie prostej regresji:
1. Reszty – różnicy między wartościami empirycznymi a teoretycznymi.
                                                                   dla 1, 2, 3 … n
- wartości empiryczne
 - wartości teoretyczne
2. Odchylenie standardowe reszt (średni punkt szacunku) mówi o ile wartości empiryczne odchylają się od wartości teoretycznych..
3. Współczynnik zbieżności – przyjmuje wartości z przedziału od 0 do 1 im wartość bliższa 0, tym funkcje regresji lepiej dopasowane.



Dynamika dział statystyki który zajmuje się badaniem zmienności zjawisk w czasie.
Zmienność zjawiska przedstawiona jest w szeregu który nazywamy szeregiem czasowym lub dynamicznym.Takie szeregi nazywamy odpowiednio szeregami momentów i szeregami okresów.
Analiza szeregów czasowych obejmuje:
1.wyznaczanie tendencji centralnej(przeciętnego poziomu zjawiska)- w szeregach momentów śr. poziom zjawiska wyznaczamy na podstawie średniej chronologicznej: w szeregach okresów średni poziom zjawiska wyznaczamy przy pomocy śr. arytmetycznej;
2.porównywanie poziomu zjawiska w czasie- podstawowym miernikiem do analizy tego zagadnienia jest wskaźnik dynamiki czyli indeks
.3. wygładzenie szeregów czasowych;
4.wyodrębnianie tendencji rozwojowej zjawiska(trendu), wahań sezonowych, czynników losowych.

Indeks stosunek wielkości zjawiska w okresie badanym do wielkości tego samego zjawiska w okresie przyjętym za podstawe porównań

Wyróżniamy dwa rodzaje indeksów:
Chcąc dokonać porównania tempa zmian dwóch lub kilku zjawisk, albo tego samego zjawiska w różnych okresach czasu obliczamy średnie tempo zmian. Posługujemy się w tym przypadku średnią geometryczną. 

Średnie tempo zmian może być obliczane jako:
1. Średnia geometryczna obliczana z indeksów łańcuchowych. Jest to pierwiastek n-tego stopnia z iloczynu n kolejnych iloczynów indeksowych:
2. Średnia geometryczna obliczana z danych empirycznych: 



Brak komentarzy:

Prześlij komentarz