Edytuj stronę Odnośniki Fold/unfold all ODT export Ta strona jest tylko do odczytu. Możesz wyświetlić źródła tej strony ale nie możesz ich zmienić. ====== Kolokwium SPSS 1.06.2010 ====== ===== Zadanie 1 ===== - Zaimportuj do SPSSa i połącz w jeden zbiór danych pliki: {{zajecia:wzm:kolokwium:winequality-white.csv|Wina białe}} {{zajecia:wzm:kolokwium:winequality-red.csv|Wina czerwone}} \\ \\ **Zbór danych:** Wine Quality \\ **Żródło:** Paulo Cortez (Univ. Minho), Antonio Cerdeira, Fernando Almeida, Telmo Matos and Jose Reis, 2009 \\ **Opis:** Próbki portugalskiego wina [[http://www.vinhoverde.pt/en/|''Vinho Verde'']] opisanych 11 obiektywnie (fizycznie) mierzalnymi zmiennymi (np. wartość pH, stężenie alkoholu) oraz opatrzone subiektywną oceną jakości dokonaną przez ekspertów (zmienna 12 ''quality''). Dane podzielono na dwie części, osobno dla win białych i czerwonych. Jakość (smak) oceniana jest w skali od 0 do 10 (gdzie 10 oznacza najlepsze wino).\\ Nazwy zmiennych zawarte są w pierwszej linijce zbioru danych. \\ Szczegółowy opis tych danych można znaleźć [[http://archive.ics.uci.edu/ml/datasets/Wine+Quality/|tutaj]]. \\ \\ **Uwaga:** jeśli nie poradzisz sobie z tym zadaniem do dalszych obliczeń użyj gotowego zbioru danych : {{zajecia:wzm:kolokwium:wine-quality2.sav|WineQuality.sav}}. \\ \\ - Korzystając ze zmiennej **alcohol** utwórz nową zmienną o nazwie **moc** przyjmującą wartości: * 1 z etykietą **słabe** dla **alcohol** < 10 * 2 z etykietą **normalne** dla 10 ≤ **alcohol** < 12 * 3 z etykietą **mocne** dla **alcohol** ≥ 12 ===== Zadanie 2 ===== Wyznacz:\\ - wartość średnią, odchylenie standardowe i medianę gęstości (''density'') dla wszystkich win, - wartość maksymalną stężenia alkoholu dla win białych, - liczbę win czerwonych o niskim poziomie alkoholu (o słabej mocy), - najczęściej występującą ocenę jakości wśród win białych oraz wśród win czerwonych - różnicę między największą i najmniejszą wartością zmiennej ''pH'' - kurtozę i wsp. asymetrii (skośność) dla zmiennej określającej ilość chlorku (''chlorides'') w grupie win o średniej mocy - przedział ufności dla wartości oczekiwanej zmiennej określającej całkowity poziom dwutlenku siarki (''total sulfur dioxide'') na poziomie ufności 90% - czy dla zmiennej ''pH'' możemu przyjąć hipotezę o tym, że wartość średnia wynosi 3 na poziomie istotności 0.05 (podaj wartość statystyki t oraz istotność)? - czy średnie stężenie alkoholu różni się istotnie (na poziomie istotności 0.1) dla win białych i czerwonych (podaj wartości statystyki testowej t oraz istotność)? - czy możemy przyjąć hipotezę (na poziomie istotności 0.01) o tym, że zmienna ''total sulfur dioxide'' pochodzi z rozkładu normalnego (wybierz test, podaj jego nazwę, wartość wyznaczonej statystyki testowej oraz istotność) - równanie prostej regresji dla zmiennych określających gęstość (''density'') i stężenie alkoholu (''alcohol''), - współczynnik korelacji liniowej Pearsona dla zmiennych ''alcohol'' i ''citric acid'' ===== Zadanie 3 ===== Przygotuj raport zawierający tabele i wykresy wyszczególnione poniżej. \\ Zapisz raport w formacie PDF podając w nazwie pliku swoje nazwisko a następnie prześlij na adres <grochu@is.umk.pl>. - Tabelę obrazującą częstości występowania win dla każdej z klas jakości wraz wykresem słupkowym to obrazującym. - Tabela krzyżowa przedstawiająca zależność liczebności win dla poszczególnych kategorii jakości (''quality'') w zależności od mocy trunku (zmienna ''moc'') - Tabelę zawierającą statystyki opisowe (wartość przeciętna, odchylenie standardowe, minimum, maksimum, rozstęp, medianę, kurtozę i skośność) dla zmiennej ''total sulfur dioxide'' osobno dla win białych. - Wykresy skrzynkowe (zgrupowane obok siebie) dla zmiennej ''total sulfur dioxide'' w podziale na wina białe i czerwone - Histogram wraz z naniesioną krzywą rozkładu normalnego dla zmiennej ''pH'' - Wykres słupkowy obrazujący średnią wartość stężenia alkoholu dla każdej z klas jakości (''quality'') - Wykres rozrzutu obrazujący zależność zmiennej ''density'' względem zmiennej ''alcohol'' (postaraj się oznaczyć różnymi kolorami wina białe i czerwone) - Wykres kołowy obrazujący procentowy udział win w podziale na moc osobno dla win białych i czerwonych.