Zjawisko masowe-wydobycie węgla, student
Przedmiotem badań statystycznych są zbiorowości statystyczne
(populacja statystyczna) które są zbiorami pewnych elementów nazywane
jednostkami statystycznymi. Przez badanie statystyczne rozumiemy ogól prac
mających na celu poznanie określonej zbiorowości statystycznej
Wyróżniamy 4 etapy
badań
I) przygotowanie badania
Zbiorowość
i jednostka powinny być precyzyjnie określone pod względem: *rzeczowym(co i
kogo badamy) *przestrzennym(gdzie się
odbywa) czasowym (kiedy jaki okres
jest objęty badaniem lub w jakiej chwili się odbywa)
4)Skala pomiarowa -nominalna(kolor oczu wyznanie religijne
pleć) -porządkowa(wykształcenie) -przedziałowa(skala temperatur) -ilorazowa 5)wybór
metody badania statystycznego
-badanie całkowite(badamy calą zbiorowość) -badanie częściowe(gdy badamy część
zbiorowości-próba)
III) Opracowanie materiału statyst. I jego
prezentowanie
a)grupowanie -typologiczne
polega na wyodrębnianiu jednorodnych grup na podstawie wariantów cech
jakościowych -wariancyjne opiera się na cechach ilościowych b)zliczanie
IV) Analiza wyników
opracowania
PARAMETRY OPISUJĄCE STRUKTURĘ ZBIOROWOŚCI STATYS.
1 Wskaźnik
struktury- to stosunek części zbiorowości wyróżniającej się wariantem lub
wartością cechy do całej zbiorowości
wi=ni/n
2.Wskaźnik
natężenia –jest to wielkość stosunkowa wyrażająca kształtowanie się
wielkości jednego zjawiska na tle drugiego logicznie z tym związanego wN=mi/ni
3.Miary
opisujące tendencje centralną
klasyczne
a)średnia arytmetyczna
Własności -jest wypadkową wszystkich
wartości zmiennej i spalania nierówność x
<x<x -wartość średniej
arytmetycznej nie zależy od liczebności klas lecz od ich wzajemnych proporcji
tzn zamiast liczebności można stosować wskaźniki struktury x=?xi*wi
-suma odchyleń poszczególnych wartości zmiennej od średniej
arytmetycznej jest równa 0 czyli ?(xi-x)=0
Średnia
arytmetyczna
jest miarą prawidłową tylko w odniesieniu d
o zbiorowości jednorodnych o
niewielkim zróżnicowaniu rozkładu a także w rozkładach biomodalnych i
wielomodalnych średnia arytmetyczna traci wartość poznawczą.
Średnia arytm. nie można obliczyć dla szeregu o otwartych przedziałach jeśli przedziały te mają duże liczebności. Umownie przyjmuje się bowiem że otwarte przedziały klasowe można zamykać wówczas gdy liczba jednostek w tych przedziałach nie przekracza 5% liczebności całej populacji
b)średnia harmoniczna stosujemy ją wtedy gdy mamy do czynienia z cechami stosunkowymi tzn gdy jedna wielkość jest dzielona przez drugą np.prędkość,gęstość zaludnienia,przeciętne ceny towarów,przeciętna szybkość obrotów pieniężnych
Średnia arytm. nie można obliczyć dla szeregu o otwartych przedziałach jeśli przedziały te mają duże liczebności. Umownie przyjmuje się bowiem że otwarte przedziały klasowe można zamykać wówczas gdy liczba jednostek w tych przedziałach nie przekracza 5% liczebności całej populacji
b)średnia harmoniczna stosujemy ją wtedy gdy mamy do czynienia z cechami stosunkowymi tzn gdy jedna wielkość jest dzielona przez drugą np.prędkość,gęstość zaludnienia,przeciętne ceny towarów,przeciętna szybkość obrotów pieniężnych
c) średnia geometryczna jest pierwiastkiem n-tego
stopnia z iloczynu n wartości danej zmiennej. Obliczamy ją wtedy gdy mamy do
czynienia z szeregiem którego wartości są bardziej zróżnicowane ponieważ jest
ona mniej wrażliwa od średniej arytmetycznej na wartości nietypowe
Średnia geometr. Znajduje zastosowanie przy badaniu
średniego tempa zmian zjawisk
Pozycyjne
a)dominanta(D
modalna,moda) –jest
to ta wartość która występuje najczęściej.
założenia:-jeden przedział musi być wyraźnie dominujący -rozpiętość tego przedziału i przedziałów
sąsiednich musi być jednakowa
Własności: -wyznaczamy ją wtedy i tylko wtedy gdy jest 1
ośrodek dominujący w przeciwnym wypadku mówimy o szeregach wielomadalnych -jeżeli w szeregu rozdzielczym z
przedziałami klasowymi dominanta występuje w skrajnych przedziałach wówczas nie
wyznaczamy jej analitycznie -wartość
dominanty nie zmieni się gdy do wzoru zamiast liczebności wstawiamy częstość
c)kwantyle
*mediana – to wartość która w
uporządkowanym szeregu statys. zajmuje pozycje środkową
Własności: -wartość mediany nie zależy od wartości
krańcowych w przeciwieństwie do średniej arytm. jest więc średnią odporną na
wartości nietypowe -można ją
wyznaczyć we wszystkich rodzajach szeregów statys. Jest często stosowane w
doświadczalnictwie, mikrobiologi
-medianę można wyznaczyć gdy liczebności wszystkich przedziałów nie są
dokładnie znane wystarczy że znamy liczbę wszystkich obserwacji i wartość
środkową
kwartyl pierwszy(Q1) jest to wartość cechy
poniżej której znajduje się 1/4 zbiorowości a powyżej 3/4 zbiorowości
*kwintyle(dzielą zbiorowość na 5
części) *decyle(dzielą zbiorowość
na 10 części) *percentyle(dzielą zbiorowość na 100 części)
4.
Miary dyspersji (rozproszenia, zróżnicowania, rozrzutu)
5.Miary
asymetrii
6.
Miary koncentracji
Współczynnik
korelacji -
służy do opisu siły korelacji dwóch cech w przypadku, gdy cechy są mierzalne, a
badana zbiorowość jest nieliczna, gdy mają one charakter jakościowy i istnieje
możliwość ich porządkowania
Współczynnik
korelacji rang wyznacza się ze wzoru
Gdzie:
-di
oznaczają różnice miedzy rangami odpowiadających sobie wartości cechy xi i yi
Współczynnik korelacji rang
przyjmuje wartości przedziału (-1:1) i jego interpretacja jest identyczna jak
współczynnik korelacji Persona.
ANALIZA REGRESJI- jest bardzo ważną metodą często stosowaną w ekonometrii i zarządzaniu.
Operuje ona modelem statystycznym.
Model statystyczny- zbiór matematycznych wzorów i założeń, które opisują pewną sytuację
zachodzącą w swiecie rzeczywistym.
Prosty model regresji liniowej: Y= Bo + B1X + E, gdzie
-Bo-
parametr przecięcia(wyraz wolny)
-B1-
parametr nachylenia(współczynnik kierunkowy)
-E-
błąd losowy
-X-
zmienna objasniająca(niezależna)
-Y-
zmienna objaśniana(zależna)
Model
ten ma zastosowanie gdy związek miedzy zmiennymi x i y maja związek liniowy.
Oszacowanie
parametrów dokonujemy metodą najmniejszych kwadratów w której ideą jest to by
dobrać takie oszacowania parametru by dla wylosowanej próby suma kwadratów
różnic pomiedzy empirycznymi wartościami zmiennej y a wartościami
przewidywanymi krzywej regresji była najmniejsza.
Bezwzględna wartość
współczynnika regresji informuje nas jak zmieni się poziom zmiennej zależnej przy wzroście
zmiennej nie zależnej o jednostkę. Znak nam informuje o kierunku zależności (+)
zależność dodatnia, wzrost jednej cechy powoduje wzrost drugiej. (-) zależność
ujemna.
Dopasowanie prostej
regresji:
1. Reszty –
różnicy między wartościami empirycznymi a teoretycznymi.



2. Odchylenie
standardowe reszt (średni punkt szacunku) mówi o ile wartości
empiryczne odchylają się od wartości teoretycznych..
3. Współczynnik zbieżności – przyjmuje wartości z
przedziału od 0 do 1 im wartość bliższa 0, tym funkcje regresji lepiej
dopasowane.
Dynamika – dział statystyki który
zajmuje się badaniem zmienności zjawisk w czasie.
Zmienność
zjawiska przedstawiona jest w szeregu który nazywamy szeregiem czasowym lub
dynamicznym.Takie szeregi nazywamy odpowiednio szeregami momentów i szeregami okresów.
Analiza szeregów
czasowych obejmuje:
1.wyznaczanie tendencji
centralnej(przeciętnego poziomu zjawiska)- w szeregach momentów śr. poziom
zjawiska wyznaczamy na podstawie średniej chronologicznej: w szeregach okresów
średni poziom zjawiska wyznaczamy przy pomocy śr. arytmetycznej;
2.porównywanie poziomu zjawiska w czasie-
podstawowym miernikiem do analizy tego zagadnienia jest wskaźnik dynamiki czyli
indeks
.3. wygładzenie szeregów czasowych;
4.wyodrębnianie tendencji rozwojowej zjawiska(trendu),
wahań sezonowych, czynników losowych.
Indeks – stosunek wielkości zjawiska w
okresie badanym do wielkości tego samego zjawiska w okresie przyjętym za
podstawe porównań
Wyróżniamy dwa
rodzaje indeksów:
Chcąc
dokonać porównania tempa zmian dwóch lub kilku zjawisk, albo tego samego
zjawiska w różnych okresach czasu obliczamy średnie tempo zmian. Posługujemy się w tym przypadku średnią
geometryczną.
Średnie
tempo zmian może być obliczane jako:
1. Średnia geometryczna
obliczana z indeksów łańcuchowych. Jest to pierwiastek n-tego stopnia z
iloczynu n kolejnych iloczynów indeksowych:
2. Średnia geometryczna obliczana z danych empirycznych:
2. Średnia geometryczna obliczana z danych empirycznych:
Brak komentarzy:
Prześlij komentarz