Kolokwium SPSS 1.06.2010

  1. Zaimportuj do SPSSa i połącz w jeden zbiór danych pliki: Wina białe Wina czerwone

    Zbór danych: Wine Quality
    Żródło: Paulo Cortez (Univ. Minho), Antonio Cerdeira, Fernando Almeida, Telmo Matos and Jose Reis, 2009
    Opis: Próbki portugalskiego wina ''Vinho Verde'' opisanych 11 obiektywnie (fizycznie) mierzalnymi zmiennymi (np. wartość pH, stężenie alkoholu) oraz opatrzone subiektywną oceną jakości dokonaną przez ekspertów (zmienna 12 quality). Dane podzielono na dwie części, osobno dla win białych i czerwonych. Jakość (smak) oceniana jest w skali od 0 do 10 (gdzie 10 oznacza najlepsze wino).
    Nazwy zmiennych zawarte są w pierwszej linijce zbioru danych.
    Szczegółowy opis tych danych można znaleźć tutaj.

    Uwaga: jeśli nie poradzisz sobie z tym zadaniem do dalszych obliczeń użyj gotowego zbioru danych : WineQuality.sav.

  2. Korzystając ze zmiennej alcohol utwórz nową zmienną o nazwie moc przyjmującą wartości:
    • 1 z etykietą słabe dla alcohol < 10
    • 2 z etykietą normalne dla 10 ≤ alcohol < 12
    • 3 z etykietą mocne dla alcohol ≥ 12

Wyznacz:

  1. wartość średnią, odchylenie standardowe i medianę gęstości (density) dla wszystkich win,
  2. wartość maksymalną stężenia alkoholu dla win białych,
  3. liczbę win czerwonych o niskim poziomie alkoholu (o słabej mocy),
  4. najczęściej występującą ocenę jakości wśród win białych oraz wśród win czerwonych
  5. różnicę między największą i najmniejszą wartością zmiennej pH
  6. kurtozę i wsp. asymetrii (skośność) dla zmiennej określającej ilość chlorku (chlorides) w grupie win o średniej mocy
  7. przedział ufności dla wartości oczekiwanej zmiennej określającej całkowity poziom dwutlenku siarki (total sulfur dioxide) na poziomie ufności 90%
  8. czy dla zmiennej pH możemu przyjąć hipotezę o tym, że wartość średnia wynosi 3 na poziomie istotności 0.05 (podaj wartość statystyki t oraz istotność)?
  9. czy średnie stężenie alkoholu różni się istotnie (na poziomie istotności 0.1) dla win białych i czerwonych (podaj wartości statystyki testowej t oraz istotność)?
  10. czy możemy przyjąć hipotezę (na poziomie istotności 0.01) o tym, że zmienna total sulfur dioxide pochodzi z rozkładu normalnego (wybierz test, podaj jego nazwę, wartość wyznaczonej statystyki testowej oraz istotność)
  11. równanie prostej regresji dla zmiennych określających gęstość (density) i stężenie alkoholu (alcohol),
  12. współczynnik korelacji liniowej Pearsona dla zmiennych alcohol i citric acid

Przygotuj raport zawierający tabele i wykresy wyszczególnione poniżej.
Zapisz raport w formacie PDF podając w nazwie pliku swoje nazwisko a następnie prześlij na adres grochu@is.umk.pl.

  1. Tabelę obrazującą częstości występowania win dla każdej z klas jakości wraz wykresem słupkowym to obrazującym.
  2. Tabela krzyżowa przedstawiająca zależność liczebności win dla poszczególnych kategorii jakości (quality) w zależności od mocy trunku (zmienna moc)
  3. Tabelę zawierającą statystyki opisowe (wartość przeciętna, odchylenie standardowe, minimum, maksimum, rozstęp, medianę, kurtozę i skośność) dla zmiennej total sulfur dioxide osobno dla win białych.
  4. Wykresy skrzynkowe (zgrupowane obok siebie) dla zmiennej total sulfur dioxide w podziale na wina białe i czerwone
  5. Histogram wraz z naniesioną krzywą rozkładu normalnego dla zmiennej pH
  6. Wykres słupkowy obrazujący średnią wartość stężenia alkoholu dla każdej z klas jakości (quality)
  7. Wykres rozrzutu obrazujący zależność zmiennej density względem zmiennej alcohol (postaraj się oznaczyć różnymi kolorami wina białe i czerwone)
  8. Wykres kołowy obrazujący procentowy udział win w podziale na moc osobno dla win białych i czerwonych.