Kolokwium SPSS 1.06.2010
Zadanie 1
- Zaimportuj do SPSSa i połącz w jeden zbiór danych pliki: Wina białe Wina czerwone
Zbór danych: Wine Quality
Żródło: Paulo Cortez (Univ. Minho), Antonio Cerdeira, Fernando Almeida, Telmo Matos and Jose Reis, 2009
Opis: Próbki portugalskiego wina ''Vinho Verde'' opisanych 11 obiektywnie (fizycznie) mierzalnymi zmiennymi (np. wartość pH, stężenie alkoholu) oraz opatrzone subiektywną oceną jakości dokonaną przez ekspertów (zmienna 12quality
). Dane podzielono na dwie części, osobno dla win białych i czerwonych. Jakość (smak) oceniana jest w skali od 0 do 10 (gdzie 10 oznacza najlepsze wino).
Nazwy zmiennych zawarte są w pierwszej linijce zbioru danych.
Szczegółowy opis tych danych można znaleźć tutaj.
Uwaga: jeśli nie poradzisz sobie z tym zadaniem do dalszych obliczeń użyj gotowego zbioru danych : WineQuality.sav.
- Korzystając ze zmiennej alcohol utwórz nową zmienną o nazwie moc przyjmującą wartości:
- 1 z etykietą słabe dla alcohol < 10
- 2 z etykietą normalne dla 10 ≤ alcohol < 12
- 3 z etykietą mocne dla alcohol ≥ 12
Zadanie 2
Wyznacz:
- wartość średnią, odchylenie standardowe i medianę gęstości (
density
) dla wszystkich win, - wartość maksymalną stężenia alkoholu dla win białych,
- liczbę win czerwonych o niskim poziomie alkoholu (o słabej mocy),
- najczęściej występującą ocenę jakości wśród win białych oraz wśród win czerwonych
- różnicę między największą i najmniejszą wartością zmiennej
pH
- kurtozę i wsp. asymetrii (skośność) dla zmiennej określającej ilość chlorku (
chlorides
) w grupie win o średniej mocy - przedział ufności dla wartości oczekiwanej zmiennej określającej całkowity poziom dwutlenku siarki (
total sulfur dioxide
) na poziomie ufności 90% - czy dla zmiennej
pH
możemu przyjąć hipotezę o tym, że wartość średnia wynosi 3 na poziomie istotności 0.05 (podaj wartość statystyki t oraz istotność)? - czy średnie stężenie alkoholu różni się istotnie (na poziomie istotności 0.1) dla win białych i czerwonych (podaj wartości statystyki testowej t oraz istotność)?
- czy możemy przyjąć hipotezę (na poziomie istotności 0.01) o tym, że zmienna
total sulfur dioxide
pochodzi z rozkładu normalnego (wybierz test, podaj jego nazwę, wartość wyznaczonej statystyki testowej oraz istotność) - równanie prostej regresji dla zmiennych określających gęstość (
density
) i stężenie alkoholu (alcohol
), - współczynnik korelacji liniowej Pearsona dla zmiennych
alcohol
icitric acid
Zadanie 3
Przygotuj raport zawierający tabele i wykresy wyszczególnione poniżej.
Zapisz raport w formacie PDF podając w nazwie pliku swoje nazwisko a następnie prześlij na adres grochu@is.umk.pl.
- Tabelę obrazującą częstości występowania win dla każdej z klas jakości wraz wykresem słupkowym to obrazującym.
- Tabela krzyżowa przedstawiająca zależność liczebności win dla poszczególnych kategorii jakości (
quality
) w zależności od mocy trunku (zmiennamoc
) - Tabelę zawierającą statystyki opisowe (wartość przeciętna, odchylenie standardowe, minimum, maksimum, rozstęp, medianę, kurtozę i skośność) dla zmiennej
total sulfur dioxide
osobno dla win białych. - Wykresy skrzynkowe (zgrupowane obok siebie) dla zmiennej
total sulfur dioxide
w podziale na wina białe i czerwone - Histogram wraz z naniesioną krzywą rozkładu normalnego dla zmiennej
pH
- Wykres słupkowy obrazujący średnią wartość stężenia alkoholu dla każdej z klas jakości (
quality
) - Wykres rozrzutu obrazujący zależność zmiennej
density
względem zmiennejalcohol
(postaraj się oznaczyć różnymi kolorami wina białe i czerwone) - Wykres kołowy obrazujący procentowy udział win w podziale na moc osobno dla win białych i czerwonych.