Miary tendencji centralnej i rozproszenia
Zadanie 1
Zbiór danych dane.dat
zawierają informacje na temat płac w pewnym przedsiębiorstwie.
W kolejnych kolumnach zbiór ten zawiera: liczbę porządkową, liczbę od 0 do 4 określającą stanowisko (0 - kierownik, 1 - członek zarządu, 2 - kierownik działu, 3 - pracownik administracji, 4 - pracownik liniowy) oraz zarobki miesięczne.
Na podstawie tych danych odpowiedz na następujące pytania:
- jaką kwotę zarabia największa liczba pracowników i jaka część pracowników zarabia tę kwotę?
- poniżej jakiej kwoty zarabia połowa pracowników?
- poniżej jakiej kwoty zarabia jedna czwarta pracowników a poniżej jakiej trzy czwarte?
- jaka jest średnia płaca pracowników, gdy pominiemy w obliczeniach 5% najlepiej zarabiających i 5% najgorzej zarabiających?
- jaka jest różnica między najwyższą a najniższą płacą w przedsiębiorstwie?
- jaka jest różnica pomiędzy płacą poniżej której zarabia 75% pracowników i płacą, poniżej której zarabia 25% pracowników?
- jakie są zarobki poszczególnych grup pracowniczych?
Przygotuj odpowiedni raport (tabele i wykresy) zawierający odpowiedzi na poszczególne pytania.
Zadanie 2
Dane wybory.dat
zawierają wynik sondażu przedwyborczego z wyborów prezydenckich w 1995 roku.
W kolumnach umieszczone są wartości odpowiadające odsetek respondentów opowiadających się za kandydaturą L. Wałęsy i A. Kwaśniewskiego w poszczególnych województwach.
Przeprowadź wszechstronną analizę charakteryzującą strukturę województw pod względem odsetek głosujących na poszczególnych kandydatów.
W którym województwie kandydaci mają największe (najmniejsze) poparcie?
Przygotuj odpowiednie wykresy (słupkowy lub liniowy) i tabele.
Kto ma większe szanse na zwycięstwo?
Przygotuj wykres słupkowy, tabelę z wynikami, wykres skrzynkowy.
Zadanie 3
W zbiorze danych Generalny sondaż społeczny 1991
dla zmiennych Ilość braci i sióstr
oraz Ilość dzieci
wyznacz modę, medianę, średnią, wartość maksymalną i minimalną, kwantyle, rozstęp, skośność i kurtozę.
Stwórz nowy zbiór danych zawierający:
- możliwe wartości zmiennej
Region
- średnią i medianę dla zmiennych
Ilość braci i sióstr
iIlość dzieci
w grupach utworzonych przez zmiennąRegioni
- liczebność obserwacji w każdej z grup zmiennej
Region
Wyznacz wartości tych samych statystyk co powyżej korzystając z danych z nowo utworzonego zbioru danych.
Jaka jest różnica pomiędzy wynikami?
Zadanie 4
Dla danych fatness.sav
:
- przeprowadź analizę zmiennych określających wagę, wysokość i siłę w wieku 18 lat
Narysuj histogram i przeprowadź interpretację uzyskanych wielkości. - narysuj wykresy liniowe przedstawiające:
zmianę średniej wagi wszystkich badanych osób
zmienne wagi jednej lub kilku wybranych osób - utwórz zmienne określające zmianę wagi pomiędzy 9 i 2 rokiem życia oraz pomiędzy 18 i 9 rokiem życia
Narysuj wykres warstwowy dla tych zmiennych.
Waga których osób zmieniła się najwięcej a których najmniej? - narysuj wykres skrzynkowy dla zmiennych leg_18 i streng_18 dla grup utworzonych względem płci.
Co można powiedzieć na podstawie wykresów?
Zadanie 5
Dla zbioru danych Absolwenci Univ. Floryda.sav
przeprowadź analizę zarobków osób które ukończyły budownictwo, inżynierię lub architekturę.
Określ wysokość płacy poniżej której zarabia 20% z tych pracowników (osobno dla mężczyzn i kobiet).