Twoim problemem jest to, że powszechną NICOŚĆ mylisz z osobistą PUSTKĄ
//-->.pos {position:absolute; z-index: 0; left: 0px; top: 0px;}Statystykato dyscyplina naukizajmująca sięmetodami zbierania,opracowywania i analizy danych ozjawiskachmasowychCelem jest:*znalezienieprawidłowościkształtujących zjawiska:- badanie strukturykosztów produkcji- badanie zmian wpoziomie i strukturze ludności naokreślonej przestrzeni i czasie- badanie związkupomiędzy stażem pracy a wydajnościąpracowników- reklamą a obrotamiPopulacja (zbiorowość statystyczna)– jest rozumiana jako zbiór wynikówwszystkich elementów, które podlegająbadaniu z punktu widzenia określonegokryterium.Próba– jest podzbiorem populacji.Część populacji, która jest analizowanaze względu na ustaloną charakterystykęw celu wyciągnięcia wniosków dlacałego zbioru (populacji).Cecha statystyczna -własnośćjednostki; elementy wchodzące w składpopulacji mają własności wspólne oraztakie, które różnicują te jednostkimiędzy sobą.Zbiór danych może byćrozpatrywany:*z punktu widzenia:- opisowego- wnioskowania statystycznegoPodział cech statystycznych:Jednym z wielu podziałów cech jest:*Mierzalne- wartości dają się wyrazić za pomocąliczb skokowe- wyrażone w różnych jednostkach: zł,tonach, sztukach, itd... ciągłe*Niemierzalne- nie dają się zmierzyć nominalne, np.płeć, zawód, kolor..- opisane na skali nominalnejporządkoweMiary statystyczne:- miary położenia- miary rozproszenia- miary asymetrii- miary koncentracjiMiary położenia (tendencjicentralnej):-P-percentylem w zbiorze liczb(uporządkowanych według wielkości)mierzy skupienie się jednostek wznaczeniu procentowym; możemyokreślić procent zbiorowościznajdujący się poniżej danejobserwacji. Szczególne percentyle:mediana i kwartale,- Dominanta(wartość modalna, moda)jest wartość, która w tym zbiorzewystępuje najczęściej- Średnia arytmetyczna (średniaklasyczna)zwaną także przeciętną jestto suma wartości wszystkich wynikówpodzielona przez ich liczbęMiary zróżnicowania:- Rozstęp - - Wariancja - w zbiorzewyników wariancją nazywamyprzeciętne kwadratowe odchylenieposzczególnych wyników od ichśredniej- Odchylenie standardowe- Odchylenie przeciętnejest średnią arytmetycznąbezwzględnych różnic pomiędzyposzczególnymi wartościami cechy awartością średniąPorównanie stopnia zróżnicowaniadwóch zbiorowości:posługujemy sięwzględnymi miernikamisą to współczynniki zmienności ichwartość wyznaczamy jako stosunekodchylenia standardowego lubnprzeciętnego do wartości średniejxixarytmetycznej pomnożony przez 100i�½1Dm�½nMiary asymetrii (skośności)Jeżeli dla tego samego zbioru danychsobliczamy100arytmetyczną,Vs�½średniąmedianęxi dominantę to pomiędzy nimimoże zachodzić jedna z trzech relacji(zależności):- x = Me = D (występuje w szeregusymetrycznym)- x < Me < D (skośność ujemna;lewostronna)- D < Me < x (skośność prawostronna,dodatnia)Miarą asymetriijest współczynnikasymetrii WASWASxD�½sprawdopodobieństwa zmiennejlosowej.Tą funkcję oznaczamyf(x)i ma onanastępujące własności:- f(x)0, dla każdego x- prawdopodobieństwo, że X przyjmiewartość między a i b jest równe mierzepola pod krzywą f(x) pomiędzypunktami a i b- całe pole pod krzywą f(x) jest równe1Rozkład dwumianowyzakładaprzeprowadzenie eksperymentupolegającego na wykonaniu ciąguidentycznych doświadczeńspełniających następujące warunki:- Są dwa możliwe wyniki każdegodoświadczenia, nazywane sukcesem iporażką. Wyniki te wykluczają się idopełniają.- Prawdopodobieństwo sukcesuoznaczane przezp, pozostaje takiesamo od doświadczenia dodoświadczenia. Prawd. porażkioznaczane przezq,jest równe 1-p.- Doświadczenia są niezależne odsiebieDwumianowy rozkładprawdopodobieństwa:nn!P(x)�½ pxqnx�½pxqnxxx!(nx)! �½E(X)�½np2�½V(X)�½npqRozkład PoissonaRozkład ten jest dobrym przybliżeniemrozkładu dwumianowego, przyzałożeniu, że liczba doświadczeń n jestduża (n>20), a prawdopodobieństwosukcesu jest małe (p<0,05)Znajduje zastosowanie w ustalaniuprawdopodobieństwa wadliwościprodukcji lub awaryjności maszynZmienne losowe i ich rozkłady- jest to funkcja, która przy zajściukażdego zdarzenia losowego wprzyjmuje konkretną wartość x(w), cozapisujemy:X: wx(w) Є RZmienna losowa może być:*skokowa(dyskretna),gdy może przyjmować wartości zezbioru przeliczalnego. Rozkłademprawdopodobieństwa zmiennej losowejskokowej jest tablica, wzór lub wykres,który przyporządkowujeprawdopodobieństwa każdej możliwejwartości zmiennej.Rozkład prawd. zmiennej losowejskokowej spełnia warunki:- P(X=x)=P(x)0 dla każdego x- SP(xi) = 1Dystrybuanta zmiennej losowejskokowej:P(x)�½xex!F(x)�½p(xi)xixWłasności dystrybuanty zmiennejskokowej:- F(x) jest niemalejąca- F(x) jest lewostronnie ciągła- przy xnieskończoności F(x)1*ciągła, gdy przyjmuje wartości zdowolnego przedziału liczbowego.Możliwe wartości takiej zmiennejtworzą zbiór nieprzeliczalny. Ciągłazmienna losowa to taka zmiennalosowa, która może przyjmowaćdowolne wartości z pewnegoprzedziału nieprzeliczalnegoPrawdopodobieństwa związane z ciągłązmienną losową X są wyznaczaneprzez funkcję gęstościRozkład normalny (Gaussa)-Rozkład normalny jest rozkładem, doktórego dąży m.in. rozkładdwumianowy gdy liczba doświadczeńn wzrasta- Okazuje się, że rozkład normalny jestrozkładem granicznym wielu innychrozkładów, w sytuacjach gdy ujawniająsię skutki różnych przypadkowychczynników pochodzących z różnychźródełFunkcja gęstości:1f(x)�½e2(x)222Standaryzowany rozkład normalny- Ponieważ istnieje nieskończenie wielenormalnych zmiennych losowych,jedną z nich wybieramy aby służyłajako pewien standard.Prawdopodobieństwa związane zwartościami przyjmowanymi przezzmienną normalną standaryzowanązostały stablicowane- oznaczamy: N(0, 1)Rozkład t-StudentaJeżeli mamy dwie zmienne losowe:- Uo rozkładzie normalnymstandaryzowanym oraz- c2o średniej równejkorazodchyleniu standardowymto zmienna losowa:Rozkład t-Studenta to rozkładcharakterystyczny dla próbek o małejliczności (ozn.n).Rozkład t charakteryzuje się stopniamiswobody oznaczanymi jakoklubdf.Wartość przeciętna rozkładu t-Studentajest równa zero, a jego wariancja przydf>2jest równadf/(df-2).W miarę jakliczbadfwzrasta, wariancja rozkładutzbliża się do jedności, tj. do wariancjirozkładu N(0, 1).ESTYMACJAZ prób reprezentatywnych obliczamywielkości statystyk, które sąestymatorami określonych parametrówpopulacji.Wyróżnia się dwa rodzaje estymacji:-estymację punktową:czyli metodę szacunku, za pomocąktórej jako wartość parametruzbiorowości generalnej przyjmuje siękonkretną wartość estymatorawyznaczonego na podstawien-elementowej próby (zakładamy, żewartość statystki z próby leży bliskowartości parametru populacji)- estymację przedziałową:za pomocą której wyznacza sięprzedział liczbowy, który z ustalonymprawdopodobieństwem zawieranieznaną wartość szacowanegoparametru zbiorowości generalnej.Własności estymatorów:- Estymator jest nieobciążony, jeżelijego wartość oczekiwana jest równaparametrowi populacji, do oszacowaniaktórej służy- Estymatora jest efektywny, jeżeli maniewielką wariancję (a tym samymniewielkie odchylenie standardowe)- Estymator jest zgodny, jeżeliprawdopodobieństwo, że jego wartośćbędzie bliska wartości szacownegoparametru, wzrasta wraz ze wzrostemliczebności próby.Przedziałem ufnościnazywamyprzedział liczbowy, o którymprzypuszczamy, z określonymprawdopodobieństwem, że mieści się wnim nieznany parametr populacjiCentralne twierdzenie graniczne -Jeżeli pobieramy próbę z populacji ośredniej μ i skończonym odchyleniustandardowym σ , to rozkład średniej zpróby , dąży do rozkładunormalnego o średniej μ i odchyleniu,gdy liczebność próby wzrastanieograniczenie, czyli dla„dostatecznie dużych n.Rozkład chi-kwadrat- Rozkład ten podobnie jak rozkład t,charakteryzuje się liczba stopniswobody, df ( df=n-1 )- W przeciwieństwie do rozkładu t,rozkład chi-kwadrat nie jestsymetryczny- Rozkład chi-kwadrat jest rozkłademprawdopodobieństwa sumy kwadratówniezależnych, standaryzowanych,normalnych zmiennych losowych.Stosuje się dwie grupy testów:parametryczne i nieparametryczne- stosowanie pierwszych wymagaprzyjęcia założeń o postaci rozkładutestowanej zmiennej losowej orazznajomości wybranych statystyk- testy nieparametryczne takich założeńnie wymagają, ale nie są tak mocne jakparametryczneHipotezy statystyczneHipoteza statystyczna to każdeprzypuszczenie dotyczące rozkładuzmiennej losowej weryfikowane napodstawie n-krotnej realizacji tejzmiennejWyróżniamy:- Hipotezyparametryczne i nieparametryczneproste i złożone-Hipotezą zerową, oznaczoną przezH0, jest hipoteza w wartości jednego zparametrów populacji (lub wielu).Tę hipotezę traktujemy jakoprawdziwą, dopóki nie uzyskamyinformacji statystycznychdostatecznych do zmiany naszegostanowiska- Hipotezą alternatywną, oznaczonąprzez H1, jest hipoteza przypisującaparametrowi (parametrom) populacjiwartość inną niż podaje to hipotezazerowaMocą testuhipotezy statystycznej jestprawdopodobieństwo odrzuceniahipotezy zerowej, gdy jest onafałszywa. moc testu = 1-βWłasności mocy testu:- Moc zależy od odległości międzywartością parametru zakładaną whipotezie zerowej a prawdziwąwartością parametru. Im większaodległość tym większa moc.- Moc zależy od wielkości odchyleniastandardowego w populacji. Immniejsze odchylenie tym większa moc.- Moc zależy od liczebności próby. Imliczniejsza próba, tym większa moc.- Moc zależy od poziomu istotnościtestu. Im niższy poziom istotności tymmniejsza moc testuTesty nieparametryczne- test zgodności chi-kwadrat, populacjama określony typ rozkładu- test serii, sprawdzenie czy próba jestlosowa?- test rangowanych znaków, czy dwiepróby pochodzą z tej samej populacji?Regresja to*modelowanie związku pomiędzydwoma zmiennymi: zależną Y orazniezależną X- regresja liniowa: model liniowy- regresja wieloraka: model nieliniowy*Analiza efektów zmian wartościpojedynczych zmiennychobjaśniających.*Prognoza wartości zmiennejobjaśnianej dla danego zestawuwartości zmiennych objaśniających.*Badanie, czy jakakolwiek zmiennaobjaśniająca ma istotny wpływ nazmienną objaśnianą.Korelacjawyraża stopień powiązaniapomiędzy zmiennymi losowymi- Korelacja pomiędzy dwomazmiennymi losowymi X i Y- w analizie korelacji badaczjednakowo traktuje obie zmienne:zależną i niezależną- pokazuje ona, na ile obie zmiennezmieniają się równocześnie w sposóbliniowy- korelacja między X iYjest taka samajak międzyYi X-Korelacja między dwiema losowymizmiennymi X iYjest miarą siły(stopnia) liniowego związku międzytymi zmiennymi- Silnie skorelowane zmiennezachowują się tak, jak gdybyrównocześnie się poruszały-kowariancja parametrcharakteryzujący zależności pomiędzyzmiennymi X i Y