Twoim problemem jest to, że powszechną NICOŚĆ mylisz z osobistą PUSTKĄ

TESTY PARAMETRYCZNE

Formalna procedura porównywania zebranych danych z hipotezą, której prawdziwość chcemy ocenić.

Hipoteza: stwierdzenie o parametrach populacji lub modelu. Wartości estymat dalekie od wartości parametru opisanej przez H0dostarczają dowodu przeciw H0

Statystyki testowe - Mierzą zgodność hipotezy zerowej i danych. Używane są do obliczania prawdopodobieństwa, które potrzebujemy do testu istotności.

Zmienne losowe ze znanym rozkładem - Im mniejsza P-wartość, tym mocniejszy dowód przeciw H0 dostarczony przez dane Można ocenić istotność dowodów przeciw hipotezie zerowej dostarczonych przez dane wykonując czynności: 1.Sformułuj hipotezę zerową H0i hipotezę alternatywną Ha. Test jest przeznaczony do oceny siły dowodów przeciw H0. Ha jest stwierdzeniem które zaakceptujemy jeśli dowody pozwolą nam odrzucić H0. 2.Oblicz wartość statystyki testowej. Ta statystyka zwykle określa jak daleko dane są od H0. Znajdź P-wartość dla obserwowanych danych. Jest to prawdopodobieństwo (przyjmując, że hipoteza zerowa jest prawdziwa), że statystyka będzie się opowiadać przeciw hipotezie co najmniej tak silnie jak z tymi danymi. 4.Sformułuj wniosek. Wybierz poziom istotnościα (jak bardzo dowód przeciw H0uznajesz za decydujący). Jeśli P-wartość jest mniejsza lub równa α-wniosek, że hipoteza alternatywna jest prawdziwa;jeśli jest większa od α-wniosek, że dane nie dostarczają wystarczająco silnego dowodu do odrzucenia H0.Twój wniosek jest podsumowaniem badań wykonanych za pomocą testu istotności. Poziom αdwustronnego testu istotności odrzuca hipotezęH0: μ = μ0 dokładnie wtedy, gdy wartośćμ0znajduje się poza przedziałem ufności dla dla μ obliczonym dla poziomu 1-α . P-wartość to najmniejszy poziom α, na którym dane są istotne.

Znając P-wartość możemy ocenić istotność na każdym poziomie. To daje więcej informacji niż sprawdzanie odrzucony-lub-nie na ustalonym poziomie istotności.

Wartośćz*, taka że P(Z>z*) jest równa zadanej liczbie a, 0<a<1, jest nazywana wartością krytyczną standardowego rozkładu normalnego. Im mniejsze a tym silniejszy dowód

Poziom ufności:mówi nam jak niezawodna jest ta metoda przy wielokrotnych powtórzeniach eksperymentu.

Margines błędu: mówi nam, jak czuła jest ta metoda lub jak bardzo przedział ogranicza szacowanie parametru

Poziom istotności: mówi nam jak wiarygodna jest ta metoda w użyciu

Moc testu: mówi nam o zdolności testu do wykrywania tego, że hipoteza zerowa jest fałszywa

Dwa typy błędów - Podczas przeprowadzania testów istotności musimy przyjąć jedną hipotezę a drugą odrzucić. 2 typy niewłaściwych decyzji:

-Jeśli odrzucimyH0(przyjmiemyHa) kiedy w rzeczywistości H0jest prawdziwe, jest to błąd pierwszego rodzaju (odniesiony do p-wartości).

-Jeśli przyjmiemy H0(odrzucimyHa) kiedy w rzeczywistości Hajest prawdziwe, jest to błąd drugiego rodzaju (odniesiony do mocy).

Prawdopodobieństwa błędów - Statystyczne wnioskowanie jest oparte na prawdopodobieństwie.

Jakakolwiek zasada podejmowania decyzji jest związana z prawdopodobieństwami popełnienia dwóch rodzajów błędów. Poziom istotności α jakiegokolwiek testu z ustalonym poziomem jest prawdopodobieństwem popełnienia błędu pierwszego rodzaju. α jest prawdopodobieństwem że test odrzuci zerową hipotezęH0 kiedy w rzeczywistości jest prawdziwa.

Moc testu przeprowadzonego na zadanym poziomie istotności α określona dla zadanej alternatywy wynosi1minusprawdopodobieństwo popełnienia błędu drugiego rodzaju dla tej alternatywy.

Ogólnie przyjęte postępowanie przy testowaniu hipotez

-Zdefiniuj H0iHatak samo jak do testu istotności.

-Popatrz na problem jak na decyzję -prawdopodobieństwa popełnienia błędów I-szego i II-ego rodzaju są powiązane.

-Błędy pierwszego rodzaju są poważniejsze. Wybierzα (poziom istotności) i rozważ testy tylko takie, gdzie prawdopodobieństwo popełnienia błędu I-szego rodzaju nie jest większe odα.

-Spośród testów wybierz ten, który ma jak najmniejsze prawdopodobieństwo popełnienia błędu II-ego rodzaju(czyli jak największą moc). Jeśli to prawdopodobieństwo jest zbyt duże, będziesz musisz wziąć większą liczbę prób żeby zmniejszyć ryzyko błędu

Testy dla wartości średniej w populacji –jednostronny test t - Niech prosta próba losowa (PPL) o liczności n jest losowana z populacji o nieznanej wart. oczekiwanejμ. Żeby zweryfikować hipotezę żeH0: μ =μ0 na podstawie PPL, oblicz statystykę t

Zmienna losowa T ma rozkładt(n-1),P-wartość dla testuH0 przeciw Ha: μ > μ0 wynosi P(T>=t) albo dla Ha: μ <μ0 P(T<=t)

Testy dla wartości średniej w populacji –dwustronny test t - Żeby zweryfikować hipotezę żeH0: μ = 115na podstawie PPL licznościn, obliczmy statystykę t

W kategoriach zmiennej losowejT z rozkłademt(n-1), P-wartość dla testuH0 przeciwHa: μ ≠μ0wynosi P(|T|>|t|)

Pary obserwacji -test t - W badaniu par obserwacji wyniki są łączone w pary i porównywane w jej obrębie.

Przykład: wyniki przed i po kursie

Pary obserwacji –analiza - Analiza par obserwacji jest konieczna kiedy mamy dwa pomiary lub obserwacje każdego obiektu i chcemy zbadać zmianę jednej względem drugiej. Zazwyczaj obserwacje w pewnym sensie są pomiarami „przed” i „po”. W każdej parze odejmuje się pomiar „przed” od pomiaru „po”. Analizuje się rozkład różnic stosując przedziały ufności i testy istotności dla jednej próby.

Wykorzystanie przedziałów ufności do wnioskowania o wartości średniej w populacji - Zakładając poziom istotności α, możemy przeprowadzić test dla wartości średniej w populacji wykorzystując przedział ufności określony dla poziomu C=1-α.

•Obliczamy dolną i górnągranicę przedziału ufności i sprawdzamy, czy μ0należy do tego przedziału.

•Jeśli tak, to nie mamy podstaw do odrzucenia hipotezy zerowej H0: μ = μ0

•Jest to równoważne przeprowadzeniu dwustronnego testu t na poziomie istotności α.

Odporność procedur t - Wnioskowanie statystyczne jest nazywane odpornym,jeśli wymagane metodyka obliczeń jest nieczuła na naruszenie przyjętych założeń.

Procedury t są dość odpornena odstępstwa od normalności rozkładu populacji z wyjątkiem obserwowania silnej skośności rozkłądu lub występowania punktów odstających. Większe próby to większa dokładność oszacowania P-wartości oraz wartości krytycznych dystrybucji t, gdy rozkład populacji nie jest normalny. W przypadku małolicznych prób, zanim przejdzie się do testów t należy narysować wykres qq lub ramkowy w celu sprawdzenia skośności i punktów ostających.

Praktyczne wskazówki do wnioskowania o średniej - Liczność próby: mniej niż15: Zastosuj procedury t jeśli dane mają w przybliżeniu rozkład normalny. Jeśli ich rozkład jest daleki od normalnego, albo zaobserwowaliśmy punkty odstające, nie używaj t.

Liczność próby co najmniej15: Można zastosować procedury t, chyba że istnieją punkty odstające lub rozkład jest bardzo skośny. Duże próby: Można stosować procedury t, nawet dla skośnych rozkładów, ale liczność musi być duża: ponad 40.

Test z dla 2 prób Naturalny estymator różnicyμ1 -μ2jest różnicą dwóch średnich prób,

Rozkład normalny próbkowania

Gdy

To rozkład normalny N(0,1)

Test t dla 2 prób- Ten test zakłada że populacje, z których wzięto próbki mają równe wariancje

 

Stopnie swobody k=2(n-1)

-Gdy n1 i n2 sa rózne i duze>30

Stopnie sw k=n1+ n2-2

-gdy n1 lub n2 <30

 

St sw k=n1+n2–2

Przybliżony test t Welch’a

nTen test oblicza przybliżoną t-wartość, taką’, dla której krytyczna wartość jest liczona jako średnia ważona pojedynczych wartości krytycznych t odpowiadających stopniom swobody dwóch prób.

-wartosc krytyczna dla błędu 1 rodzaju

Test dla wariancji w populacji

-rozklad x2

-odczytac wartosci krytyczne

-akceptacja lub odrzucenie hipotezy

ROZKLAD F wykorzystujemy wariancje z próby s2

-Stopnie swobody

V1=n1-1

V2=n2-1

TEST BARLETA DLA JEDNORODNYCH WARIANCJI

-naturalne logarytmy z wariancij Ln(s2)

-suma st swobody

-srednia wazona wariancji

S2=(n1*s12+n2*s22)/n1+n2

-ln(s2)

-suma wazona logarytmow wariancji składowych

-statystyka teskowa X2

-korekta skalujaca c

-skorygowana wartosc=x2/c

-sprawdzenie wartosci kryt alfa

Testy zgodności dopasowania

Testy zgodności - Te metody znajdują głównie zastosowanie przy analizie danych w skali nominalnej, pozwalają sprawdzić czy obserwowany rozkład zliczeń(nigdy częstotliwości lub proporcji) zgadza się z rozkładem hipotetycznym. Można je również stosować dla danych pomiarowych i rangowych, np.. chi-kwadrat.

Test G (logarytmiczny test ilorazu wiarygodności) – bazuje na logarytmie stosunków wiarygodności. Jeśli obserwowane proporcje są zgodne z proporcjami z hipotezy zerowej, obydwa obliczone wcześniej prawdopodobieństwa będą równe L. Test ten oparty jest właśnie na stosunku tych dwóch prawdopodobieństw lub wiarygodności może być użyty w formie statystyki do zmierzenia zgodności między zliczeniami w próbie. G=2lnL.

Test chi-kwadrat zgodności dopasowania - Najpierw obliczamy odchylenia zliczeń obserwowanych od zliczeń oczekiwanych i podnosimy je do kwadratu .Następnie obliczamy względne kwadraty odchyleń -dzielimy je przez liczbę zliczeń oczekiwanych. Ostatecznie sumujemy otrzymane wartości .Otrzymana statystyka jest nazywana statystyką chi-kwadrat X2,ale ma ona jedynie rozkład przybliżony do rozkładu X2z jednym stopniem swobody. Test chi-kwadrat jest zawsze jednostronny

Korekty na nieciągłość - Jeśli liczność próby jest <200 musimy stosować korekty na nieciągłość.

Test Kołmogorowa-Smirnowa -Nieparametryczny test, stosowany do analizy zmiennych o ciągłych i dyskretnych rozkładach częstości, mający większą moc niż testy zgodności G i X2. jest szczególnie przydatny dla małych prób, nie jest wskazane grupowanie klas. Jest to test jednostronny. Oparty na różnicach między dwiema dystrybuantami rozkładów obserwowanych i oczekiwanych. Powinien być stosowany dla dyskretnych w skali porządkowej. Analizę przeprowadzamy porównując skumulowane zliczenia obserwowane i oczekiwane. Za statystykę testową przyjmuje się największą różnicę między nimi:  dmax=max|di|. Wartość ta jest porównywana z wartością krytyczną: dkryt=n·Dn(α).

Test K2D’Agostino - Statystyka testowa pozwalająca na ocenę odstępstw rozkładu zmiennej losowej od rozkładu normalnego wyznaczana jest w oparciu o zmodyfikowane wartości kurtozy i skośności z próby.

ANOVA

anova –analiza wariancji Metoda ta wyjaśnia, z jakim prawdopodobieństwem wyodrębnione czynniki mogą być powodem różnic między obserwowanymi średnimi grupowymi.

K1 w tab dla kazdej gr+suma totalna

-suma wartosci z danej grupy ΣY

-ilosc liczb w grupie n

-średnia z wartosci Ysr

-odchylenie standardoweΣ(Y-Ysr)2

K2

-SSamong: Σn(Ysr-Ysrtot)2

-SSwithin: Σ (Σ(Y-Ysr)2)

-SStotal: SSa+SSw

K3

K4 a-liczba grup

K5  wariancja

...

  • zanotowane.pl
  • doc.pisz.pl
  • pdf.pisz.pl
  • jucek.xlx.pl






  • Formularz

    POst

    Post*

    **Add some explanations if needed