Twoim problemem jest to, że powszechną NICOŚĆ mylisz z osobistą PUSTKĄ
Mariola Szydełko 26.10.2010 Rzeszów
II CC DI
Statystyka i opracowanie wyników
Ćwiczenie nr 1
ZARZĄDZANIE DANYMI W PROGRAMIE STATISTICA (STATSOFT).
BADANIE EMPIRYCZNEGO ROZKŁADU ZMIENNEJ. CHARAKTERYSTYKI LICZBOWE ROZKŁADU ZMIENNEJ.
WSTĘP TEORETYCZNY:
STATISTICA jest uniwersalnym, zintegrowanym systemem służącym do statystycznej analizy danych, tworzenia wykresów, operowania na bazach danych, wykonywania transformacji danych i tworzenia aplikacji. W skład sytemu wchodzi wszechstronny zestaw zaawansowanych procedur analitycznych, stosowanych w nauce, biznesie, technice oraz zgłębianiu danych. STATISTICA zawiera nie tylko procedury statystyczne i graficzne ogólnego przeznaczenia i związane z nimi narzędzia zarządzania danymi, ale także specjalistyczne techniki analityczne (np. do badań społecznych, biomedycznych, technicznych).
Średnia jest najpopularniejszą miarą tendencji centralnej (oprócz średnich klasycznych istnieją także mediana i modalna). Informuje o przeciętnym poziomie cechy, nie odzwierciedlając różnic pomiędzy poszczególnymi jednostkami. Obliczanie jej wartości ma sens tylko wtedy, gdy zbiorowość jest jednorodna.
Mediana (zwana też wartością środkową lub drugim ) to w wartość cechy w szeregu uporządkowanym, powyżej i poniżej której znajduje się jednakowa liczba obserwacji. Mediana jest rzędu 1/2, czyli drugim .
Dominanta (wartość modalna, moda, wartość najczęstsza) to jedna z , dla o , wskazująca na wartość o największym wystąpienia, lub wartość najczęściej występująca w próbie. Dla o jest to wartość, dla której ma wartość największą.
Odchylenie standardowe jest to miara , obok najczęściej stosowane pojęcie . Intuicyjnie rzecz ujmując, odchylenie standardowe mówi, jak szeroko wartości jakiejś (takiej jak np. wiek, , itp.) są rozrzucone wokół jej . Im mniejsza wartość odchylenia tym obserwacje są bardziej skupione wokół średniej.
Wariancja mierzy średni "rozrzut" wartości zmiennej losowej od jej wartości średniej.
Kurtoza jest to względna miara koncentracji i spłaszczenia rozkładu (termin stosowany w statystyce i rachunku prawdopodobieństwa). Określa rozmieszczenie i koncentrację wartości (zbiorowości) w pobliżu średniej.
Minimum i maksimum inaczej odpowiednio element najmniejszy i największy danego . Często w zastosowaniach praktycznych rozważany zbiór ma skończenie wiele elementów (np. tylko dwa).
CO ZOSTAŁO WYKONANE:
Włączono już stworzony plik w programie Statistica o nazwie Azot.
Dodano 1 nową zmienną MASA, którą umieszczono po zmiennej zbiornik.
(ZARZĄDZANIE DANYMI à DANE à ZMIENNE à DODAJ).
Następnie zmieniono położenie naszej danej. Umiejscowiono ją po zmiennej stężenie.
(DANE à ZMIENNE à PRZENIEŚ, od zmiennej zbiornik do zbiornik).
Następnie skopiowane zamienną stężenie.
(DANE à ZMIENNE à KOPIUJ, stężenie do masa po masa).
Następnie zajęto się przypadkami.
Dodano nowe przypadki ( DANE à PRZYPADKI à DODAJ, dodano 3 nowe przypadki po 3 przypadku).
Przeniesiono przypadki (DANE à PRZYPADKI à PRZENIEŚ, przypadki od 4 do 6 wstawiono po przypadku 10).
Proces sortowania danych.
Zaznaczono odpowiednia kolumnę z odpowiednimi danymi, następnie DANE à SORTUJ à ROSNĄCO.
Proces przekodowania:
Zaznaczono odpowiednie dane, następnie DANE à PRZEKODUJ.
Do danej odwołujemy się za pomocą literki V, indeks dolny przy niej wskazuje Nam określoną kolumnę w której się zmienna znajduje. W moim przypadku było to V1.
Wpisano: V1 < 30 à niskie,
V1 => 30 and V1 < 60 à średnie
V1 => 50 à wysokie
Proces tworzenia nowych etykiet tekstowych.
Do kolumny zbiornik zamiast B wpisano C. Wyskoczył odpowiedni komunikat, należy wówczas zaznaczyć opcje, aby program utworzył nową etykietę tekstową.
Proces sprawdzania danych:
DANE à SPRAWDZANIE DANYCH.
Warunek poprawności:
Poprawne, jeśli: V3 = ‘A’ OR V3 = ‘B’. Została podświetlona linijka, gdzie zostało wpisane C.
Utworzono nowy plik składający się z 10 zmiennych i 2 przypadków (Dzień, Miesiąc, Rok, Data,Rok, Miesiąc). Wpisano przypadkowe liczby.
DANE à OPERACJE NA DATACH
Wybrano format 17-Mar-98.
Nazwa Data.
Wybrano zmienne źródłowe. Stwórz datę z 2 lub 3 zmiennych. Zapisano do konkretnej kolumny.
Następnie rozdzielono datę na 2 lub 3 zmienne i zapisano do konkretnych kolumn.
Utworzono nowy plik, który posiadał tylko 1 zmienną i 50 przypadków. Nasza zmienna nazywała się ŁADUNEK ELEKTRONU. Wartości zmiennej przepisano z kartki otrzymanej od prowadzącego zajęcia.
Zaznaczono odpowiednią sekwencje, co program musi wykonać.
Ostatecznie otrzymaliśmy tabele, w której były wartości: n ważnych, średnia, mediana, moda, liczność mody, minimum, maksimum, wariancja, odchylenie standardowe, skośność, kurtoza.