Twoim problemem jest to, że powszechną NICOŚĆ mylisz z osobistą PUSTKĄ

Mariola Szydełko                                                                                                  26.10.2010 Rzeszów

II CC DI

Statystyka i opracowanie wyników

Ćwiczenie nr  1

 

ZARZĄDZANIE DANYMI W PROGRAMIE STATISTICA (STATSOFT).

BADANIE EMPIRYCZNEGO ROZKŁADU ZMIENNEJ.  CHARAKTERYSTYKI LICZBOWE ROZKŁADU ZMIENNEJ.

 

WSTĘP TEORETYCZNY:

STATISTICA jest uniwersalnym, zintegrowanym systemem służącym do statystycznej analizy danych, tworzenia wykresów, operowania na bazach danych, wykonywania transformacji danych i tworzenia aplikacji. W skład sytemu wchodzi wszechstronny zestaw zaawansowanych procedur analitycznych, stosowanych w nauce, biznesie, technice oraz zgłębianiu danych. STATISTICA zawiera nie tylko procedury statystyczne i graficzne ogólnego przeznaczenia i związane z nimi narzędzia zarządzania danymi, ale także specjalistyczne techniki analityczne (np. do badań społecznych, biomedycznych, technicznych).

Średnia jest najpopularniejszą miarą tendencji centralnej (oprócz średnich klasycznych istnieją także mediana i modalna). Informuje o przeciętnym poziomie cechy, nie odzwierciedlając różnic pomiędzy poszczególnymi jednostkami. Obliczanie jej wartości ma sens tylko wtedy, gdy zbiorowość jest jednorodna.

Mediana (zwana też wartością środkową lub drugim ) to w wartość cechy w szeregu uporządkowanym, powyżej i poniżej której znajduje się jednakowa liczba obserwacji. Mediana jest rzędu 1/2, czyli drugim .

Dominanta (wartość modalna, moda, wartość najczęstsza) to jedna z , dla o , wskazująca na wartość o największym wystąpienia, lub wartość najczęściej występująca w próbie. Dla o jest to wartość, dla której ma wartość największą.

Odchylenie standardowe jest to miara , obok najczęściej stosowane pojęcie . Intuicyjnie rzecz ujmując, odchylenie standardowe mówi, jak szeroko wartości jakiejś (takiej jak np. wiek, , itp.) są rozrzucone wokół jej . Im mniejsza wartość odchylenia tym obserwacje są bardziej skupione wokół średniej.

 

Wariancja mierzy średni "rozrzut" wartości zmiennej losowej od jej wartości średniej.

Kurtoza jest to względna miara koncentracji i spłaszczenia rozkładu (termin stosowany w statystyce i rachunku prawdopodobieństwa). Określa rozmieszczenie i koncentrację wartości (zbiorowości) w pobliżu średniej.

Minimum i maksimum inaczej odpowiednio element najmniejszy i największy danego . Często w zastosowaniach praktycznych rozważany zbiór ma skończenie wiele elementów (np. tylko dwa).

CO ZOSTAŁO WYKONANE:

Włączono już stworzony plik w programie Statistica o nazwie Azot.

Dodano 1 nową zmienną MASA, którą umieszczono po zmiennej zbiornik.

(ZARZĄDZANIE DANYMI à DANE à ZMIENNE à DODAJ).

Następnie zmieniono położenie naszej danej. Umiejscowiono ją po zmiennej stężenie.

(DANE à ZMIENNE à PRZENIEŚ, od zmiennej zbiornik do zbiornik).

Następnie skopiowane zamienną stężenie.

(DANE à ZMIENNE à KOPIUJ, stężenie do masa po masa).

Następnie zajęto się przypadkami.

Dodano nowe przypadki ( DANE à PRZYPADKI à DODAJ, dodano 3 nowe przypadki po 3 przypadku).

Przeniesiono przypadki (DANE à PRZYPADKI à PRZENIEŚ, przypadki od 4 do 6 wstawiono po przypadku  10).

Proces sortowania danych.

Zaznaczono odpowiednia kolumnę z odpowiednimi danymi, następnie DANE à SORTUJ à ROSNĄCO.

Proces przekodowania:

Zaznaczono odpowiednie dane, następnie DANE  à PRZEKODUJ.

Do danej odwołujemy się za pomocą literki V, indeks dolny przy niej wskazuje Nam określoną kolumnę w której się zmienna znajduje. W moim przypadku było to V1.

Wpisano: V1 < 30 à niskie,

                   V1 => 30 and V1 < 60 à średnie

                   V1 => 50 à wysokie

 

 

Proces tworzenia nowych etykiet tekstowych.

Do kolumny zbiornik zamiast B wpisano C. Wyskoczył odpowiedni komunikat, należy wówczas zaznaczyć opcje, aby program utworzył nową etykietę tekstową.

Proces sprawdzania danych:

DANE à SPRAWDZANIE DANYCH.

Warunek poprawności:

Poprawne, jeśli:  V3 = ‘A’ OR V3 = ‘B’. Została podświetlona linijka, gdzie zostało wpisane C.

Utworzono nowy plik składający się z 10 zmiennych i 2 przypadków (Dzień, Miesiąc, Rok, Data,Rok, Miesiąc). Wpisano przypadkowe liczby.

DANE à OPERACJE NA DATACH

Wybrano format  17-Mar-98.

Nazwa Data.

Wybrano zmienne źródłowe.  Stwórz datę z 2 lub 3 zmiennych. Zapisano do konkretnej kolumny.

Następnie rozdzielono datę na 2 lub 3 zmienne i zapisano do konkretnych kolumn.     

Utworzono nowy plik, który posiadał tylko 1 zmienną i 50 przypadków. Nasza zmienna nazywała się ŁADUNEK ELEKTRONU. Wartości zmiennej przepisano z kartki otrzymanej od prowadzącego zajęcia.

Zaznaczono odpowiednią sekwencje, co program musi wykonać.

Ostatecznie otrzymaliśmy tabele, w której były wartości: n ważnych, średnia, mediana, moda, liczność  mody, minimum, maksimum, wariancja, odchylenie standardowe, skośność, kurtoza.          

 

 

 

 

 

 

 

 

 

 

                                            

  • zanotowane.pl
  • doc.pisz.pl
  • pdf.pisz.pl
  • jucek.xlx.pl






  • Formularz

    POst

    Post*

    **Add some explanations if needed