rm(list = ls())

#Wczytanie danych
dane_pretest_dzieci <- read.csv("AnkietyPotrafie_Pretest_Dzieci.csv", sep = ";", encoding = "ASCII", stringsAsFactors = FALSE)
dane_pretest_rodzice <- read.csv("AnkietyPotrafie_Pretest_Rodzice.csv", sep = ";", encoding = "ASCII", stringsAsFactors = FALSE)
dane_posttest_dzieci <- read.csv("AnkietyPotrafie_Posttest_Dzieci.csv", sep = ";", encoding = "ASCII", stringsAsFactors = FALSE)
dane_posttest_rodzice <- read.csv("AnkietyPotrafie_Posttest_Rodzice.csv", sep = ";", encoding = "ASCII", stringsAsFactors = FALSE)

nrow(dane_pretest_dzieci)
nrow(dane_pretest_rodzice)
nrow(dane_posttest_dzieci)
nrow(dane_posttest_rodzice)

head(dane_pretest_dzieci) #podgląd pojawi się pod chunkiem
print.data.frame(head(dane_pretest_dzieci, n = 3))

#przydzial_grup <- dane_pretest_dzieci[1,]
#przydzial_grup[['B3']]
#przydzial_grup$B3

#levels(dane_pretest_dzieci$N4)
#dane_pretest_dzieci <- dane_pretest_dzieci[-c(1),]
#levels(dane_pretest_dzieci$N4)
#dane_pretest_dzieci <- droplevels(dane_pretest_dzieci)
#levels(dane_pretest_dzieci$N4)

nrow(dane_pretest_dzieci)
nrow(dane_pretest_rodzice)
nrow(dane_posttest_dzieci)
nrow(dane_posttest_rodzice)

########WYBRANIE PYTAŃ NIEZWIĄZANYCH Z ĆWICZENIAMI W GRZE
#To zakomentować, jeżeli wyniki dla całej ankiety
pytania_z_gry <- c(12:15, 23:26, 35:43, 45, 48:63)
pytania_z_gry
dane_pretest_dzieci <- dane_pretest_dzieci[pytania_z_gry,]
dane_pretest_rodzice <- dane_pretest_rodzice[pytania_z_gry,]
dane_posttest_dzieci <- dane_posttest_dzieci[pytania_z_gry,]
dane_posttest_rodzice <- dane_posttest_rodzice[pytania_z_gry,]
#stopifnot(FALSE)

nrow(dane_pretest_dzieci)
nrow(dane_pretest_rodzice)
nrow(dane_posttest_dzieci)
nrow(dane_posttest_rodzice)

#usunięcie całych pustych kolumn (nie mają NA, a "", bo łańcuchy)
#np. kolumna N4 w dane_pretest_dzieci

dane_pretest_dzieci$B3
dane_pretest_dzieci$N4

#puste_kolumny <- apply(dane_pretest_dzieci=="",2,all)
#puste_kolumny
#dane_pretest_dzieci <- dane_pretest_dzieci[,!puste_kolumny]

usunPusteKolumny <- function(df)
{
  puste_kolumny <- apply(df=="" | is.na(df),2,all) #is.na w przypadku gdy nie ma nawet nagłówka
  puste_kolumny
  result <- df[,!puste_kolumny]
  return(result)
}

dane_pretest_dzieci <- usunPusteKolumny(dane_pretest_dzieci)
dane_pretest_rodzice <- usunPusteKolumny(dane_pretest_rodzice)
dane_posttest_dzieci <- usunPusteKolumny(dane_posttest_dzieci)
dane_posttest_rodzice <- usunPusteKolumny(dane_posttest_rodzice)

#można też przy czytaniu użyć parametru na.strings=c("","NA")
dane_pretest_dzieci[dane_pretest_dzieci == ""] <- NA 
dane_pretest_rodzice[dane_pretest_rodzice == ""] <- NA
dane_posttest_dzieci[dane_posttest_dzieci == ""] <- NA
dane_posttest_rodzice[dane_posttest_rodzice == ""] <- NA

#obliczanie wyników dla poszczególnych badanych (średnia z wypełnionych komórek)

#gdyby nie strinAsFactors, zmieniałby na liczby czynniki (łańcuchy są zmieniane na warości czynników; NA = 1, 1 = 2 itd)
dane_pretest_dzieci$B2
as.numeric(dane_pretest_dzieci$B2)
as.integer(dane_pretest_dzieci$B2)

#dane_pretest_dzieci <- dane_pretest_dzieci[,-c(1)]
dane_pretest_dzieci_n = as.data.frame(sapply(dane_pretest_dzieci[,-c(1)], as.numeric))
dane_pretest_rodzice_n = as.data.frame(sapply(dane_pretest_rodzice[,-c(1)], as.numeric))
dane_posttest_dzieci_n = as.data.frame(sapply(dane_posttest_dzieci[,-c(1)], as.numeric))
dane_posttest_rodzice_n = as.data.frame(sapply(dane_posttest_rodzice[,-c(1)], as.numeric))

min(dane_pretest_dzieci_n, na.rm = TRUE)
max(dane_pretest_dzieci_n, na.rm = TRUE)

#obliczanie średnich dla poszczególnych badanych
dane_pretest_dzieci_means <- colMeans(dane_pretest_dzieci_n, na.rm = TRUE)
dane_pretest_rodzice_means <- colMeans(dane_pretest_rodzice_n, na.rm = TRUE)
dane_posttest_dzieci_means <- colMeans(dane_posttest_dzieci_n, na.rm = TRUE)
dane_posttest_rodzice_means <- colMeans(dane_posttest_rodzice_n, na.rm = TRUE)
dane_pretest_dzieci_means
dane_pretest_rodzice_means
dane_posttest_dzieci_means
dane_posttest_rodzice_means

mean(dane_pretest_dzieci_means);sd(dane_pretest_dzieci_means)
mean(dane_pretest_rodzice_means);sd(dane_pretest_rodzice_means)
mean(dane_posttest_dzieci_means);sd(dane_posttest_dzieci_means)
mean(dane_posttest_rodzice_means);sd(dane_posttest_rodzice_means)

#porównanie średnich z pre- i posttestów

#podział na grupy
przydzial_grup <- read.csv("Grupy.csv", sep = ";", encoding = "ASCII", stringsAsFactors = FALSE)
przydzial_grup
grupa_B <- przydzial_grup[przydzial_grup$Grupa == "B",]$Kod.badanego
grupa_K <- przydzial_grup[przydzial_grup$Grupa == "K",]$Kod.badanego
grupa_B
grupa_K

#wykluczenie dzieci, które nie grały (osobny chunk, który trzeba wcześniej uruchomić)
#grupa_B <- grupa_B_wspolna_dzieci_bez_zer
#grupa_B

#pretest-dzieci
names(dane_pretest_dzieci_means)
dane_pretest_dzieci_means_B <- dane_pretest_dzieci_means[grupa_B]
dane_pretest_dzieci_means_B <- dane_pretest_dzieci_means_B[!is.na(dane_pretest_dzieci_means_B)]

dane_pretest_dzieci_means_K <- dane_pretest_dzieci_means[grupa_K]
dane_pretest_dzieci_means_K <- dane_pretest_dzieci_means_K[!is.na(dane_pretest_dzieci_means_K)]

#dane_pretest_dzieci_mean_B <- mean(dane_pretest_dzieci_means_B)
#dane_pretest_dzieci_mean_B

#dane_pretest_dzieci_mean_K <- mean(dane_pretest_dzieci_means_K)
#dane_pretest_dzieci_mean_K

#posttest-dzieci
names(dane_pretest_dzieci_means)
dane_posttest_dzieci_means_B <- dane_posttest_dzieci_means[grupa_B]
dane_posttest_dzieci_means_B <- dane_posttest_dzieci_means_B[!is.na(dane_posttest_dzieci_means_B)]

dane_posttest_dzieci_means_K <- dane_posttest_dzieci_means[grupa_K]
dane_posttest_dzieci_means_K <- dane_posttest_dzieci_means_K[!is.na(dane_posttest_dzieci_means_K)]

#dane_posttest_dzieci_mean_B <- mean(dane_posttest_dzieci_means_B)
#dane_posttest_dzieci_mean_B

#dane_posttest_dzieci_mean_K <- mean(dane_posttest_dzieci_means_K)
#dane_posttest_dzieci_mean_K

#pretest-rodzice
names(dane_pretest_rodzice_means)
dane_pretest_rodzice_means_B <- dane_pretest_rodzice_means[grupa_B]
dane_pretest_rodzice_means_B <- dane_pretest_rodzice_means_B[!is.na(dane_pretest_rodzice_means_B)]

dane_pretest_rodzice_means_K <- dane_pretest_rodzice_means[grupa_K]
dane_pretest_rodzice_means_K <- dane_pretest_rodzice_means_K[!is.na(dane_pretest_rodzice_means_K)]

#dane_pretest_rodzice_mean_B <- mean(dane_pretest_rodzice_means_B)
#dane_pretest_rodzice_mean_B

#dane_pretest_rodzice_mean_K <- mean(dane_pretest_rodzice_means_K)
#dane_pretest_rodzice_mean_K

#posttest-rodzice
names(dane_pretest_rodzice_means)
dane_posttest_rodzice_means_B <- dane_posttest_rodzice_means[grupa_B]
dane_posttest_rodzice_means_B <- dane_posttest_rodzice_means_B[!is.na(dane_posttest_rodzice_means_B)]

dane_posttest_rodzice_means_K <- dane_posttest_rodzice_means[grupa_K]
dane_posttest_rodzice_means_K <- dane_posttest_rodzice_means_K[!is.na(dane_posttest_rodzice_means_K)]

#dane_posttest_rodzice_mean_B <- mean(dane_posttest_rodzice_means_B)
#dane_posttest_rodzice_mean_B

#dane_posttest_rodzice_mean_K <- mean(dane_posttest_rodzice_means_K)
#dane_posttest_rodzice_mean_K

#==== DZIECI ====
#prettest-posttest - powtórzony pomiar -> próby zależne
#B-K - próby niezależne

#PORÓWNANIE GRUP B i K W PRETEŚCIE (próby niezaleźne)
length(dane_pretest_dzieci_means_B)
length(dane_pretest_dzieci_means_K)
shapiro.test(dane_pretest_dzieci_means_B)$p.value #> 0.05
shapiro.test(dane_pretest_dzieci_means_K)$p.value
#oba rozkłady są normalne
t.test(dane_pretest_dzieci_means_B,dane_pretest_dzieci_means_K,paired = FALSE) #p = 0.49 - próby nie są różne

#Porównanie grup B i K w postteście
length(dane_posttest_dzieci_means_B)
length(dane_posttest_dzieci_means_K)
shapiro.test(dane_posttest_dzieci_means_B)$p.value #> 0.05
shapiro.test(dane_posttest_dzieci_means_K)$p.value
#oba rozkłady są normalne, choć p jest wyraźnie mniejsze
t.test(dane_posttest_dzieci_means_B,dane_posttest_dzieci_means_K,paired = FALSE) #p = 0.1 - tendencja
wilcox.test(dane_posttest_dzieci_means_B,dane_posttest_dzieci_means_K,paired = FALSE) #p = 0.1 - tendencja
#stopifnot(FALSE)

#PORÓWNANIE PRETESTÓW I POSTTESTÓW DLA OBU GRUP (próby zależne)

#trzeba znaleźć wspólny podzbiór
grupa_B_wspolna_dzieci <- intersect(names(dane_pretest_dzieci_means_B),names(dane_posttest_dzieci_means_B))
grupa_B_wspolna_dzieci
length(grupa_B_wspolna_dzieci)
t.test(dane_pretest_dzieci_means_B[grupa_B_wspolna_dzieci],dane_posttest_dzieci_means_B[grupa_B_wspolna_dzieci],paired = TRUE)
wilcox.test(dane_pretest_dzieci_means_B[grupa_B_wspolna_dzieci],dane_posttest_dzieci_means_B[grupa_B_wspolna_dzieci],paired = TRUE)

#sprawdzenie kolejności
dane_pretest_dzieci_means_B[grupa_B_wspolna_dzieci]
dane_posttest_dzieci_means_B[grupa_B_wspolna_dzieci]

grupa_K_wspolna_dzieci <- intersect(names(dane_pretest_dzieci_means_K),names(dane_posttest_dzieci_means_K))
grupa_K_wspolna_dzieci
length(grupa_K_wspolna_dzieci)
t.test(dane_pretest_dzieci_means_K[grupa_K_wspolna_dzieci],dane_posttest_dzieci_means_K[grupa_K_wspolna_dzieci],paired = TRUE)

#Sprawdzenie jak obliczana jest różnica
grupa_B_wspolna_dzieci
dane_pretest_dzieci_means_B
dane_pretest_dzieci_means_B[grupa_B_wspolna_dzieci]
mean(dane_pretest_dzieci_means_B[grupa_B_wspolna_dzieci],na.rm = FALSE)
mean(dane_posttest_dzieci_means_B[grupa_B_wspolna_dzieci],na.rm = FALSE)
mean(dane_posttest_dzieci_means_B[grupa_B_wspolna_dzieci],na.rm = FALSE)-mean(dane_pretest_dzieci_means_B[grupa_B_wspolna_dzieci],na.rm = FALSE)

#==== RODZICE ====
#prettest-posttest - powtórzony pomiar -> próby zależne
#B-K - próby niezależne

#PORÓWNANIE GRUP B i K W PRETEŚCIE (próby niezaleźne)
length(dane_pretest_rodzice_means_B)
length(dane_pretest_rodzice_means_K)
shapiro.test(dane_pretest_rodzice_means_B)$p.value #> 0.05
shapiro.test(dane_pretest_rodzice_means_K)$p.value
#oba rozkłady są normalne
t.test(dane_pretest_rodzice_means_B,dane_pretest_rodzice_means_K,paired = FALSE) #p = 0.49 - próby nie są różne

#Porównanie grup B i K w postteście
length(dane_posttest_rodzice_means_B)
length(dane_posttest_rodzice_means_K)
shapiro.test(dane_posttest_rodzice_means_B)$p.value #> 0.05
shapiro.test(dane_posttest_rodzice_means_K)$p.value
#oba rozkłady są normalne, choć p jest wyraźnie mniejsze
t.test(dane_posttest_rodzice_means_B,dane_posttest_rodzice_means_K,paired = FALSE) #p = 0.1 - tendencja
wilcox.test(dane_posttest_rodzice_means_B,dane_posttest_rodzice_means_K,paired = FALSE)
#stopifnot(FALSE)

#PORÓWNANIE PRETESTÓW I POSTTESTÓW DLA OBU GRUP (próby zależne)

#trzeba znaleźć wspólny podzbiór
grupa_B_wspolna_rodzice <- intersect(names(dane_pretest_rodzice_means_B),names(dane_posttest_rodzice_means_B))
#####!!!!!!!!!!!!!UWAGA! Ta sama zmienna wykorzystywana w różnych kontekstach. Wyrywkowe uruchamianie może być bez sensu
grupa_B_wspolna_rodzice
length(grupa_B_wspolna_rodzice)
t.test(dane_pretest_rodzice_means_B[grupa_B_wspolna_rodzice],dane_posttest_rodzice_means_B[grupa_B_wspolna_rodzice],paired = TRUE)
wilcox.test(dane_pretest_rodzice_means_B[grupa_B_wspolna_rodzice],dane_posttest_rodzice_means_B[grupa_B_wspolna_rodzice],paired = TRUE)

grupa_K_wspolna_rodzice <- intersect(names(dane_pretest_rodzice_means_K),names(dane_posttest_rodzice_means_K))
grupa_K_wspolna_rodzice
length(grupa_K_wspolna_rodzice)
t.test(dane_pretest_rodzice_means_K[grupa_K_wspolna_rodzice],dane_posttest_rodzice_means_K[grupa_K_wspolna_rodzice],paired = TRUE)

#==== DZIECI vs RODZICE ====

#PRETEST, B
grupa_B_wspolna_pretest_dr <- intersect(names(dane_pretest_dzieci_means_B),names(dane_pretest_rodzice_means_B))
grupa_B_wspolna_pretest_dr
length(grupa_B_wspolna_pretest_dr)
t.test(dane_pretest_dzieci_means_B[grupa_B_wspolna_pretest_dr],dane_pretest_rodzice_means_B[grupa_B_wspolna_pretest_dr],paired = TRUE)

#PRETEST, K
grupa_K_wspolna_pretest_dr <- intersect(names(dane_pretest_dzieci_means_K),names(dane_pretest_rodzice_means_K))
grupa_K_wspolna_pretest_dr
length(grupa_K_wspolna_pretest_dr)
t.test(dane_pretest_dzieci_means_K[grupa_K_wspolna_pretest_dr],dane_pretest_rodzice_means_K[grupa_K_wspolna_pretest_dr],paired = TRUE)

#POSTTEST, B
grupa_B_wspolna_posttest_dr <- intersect(names(dane_posttest_dzieci_means_B),names(dane_posttest_rodzice_means_B))
grupa_B_wspolna_posttest_dr
length(grupa_B_wspolna_posttest_dr)
t.test(dane_posttest_dzieci_means_B[grupa_B_wspolna_posttest_dr],dane_posttest_rodzice_means_B[grupa_B_wspolna_posttest_dr],paired = TRUE)
wilcox.test(dane_posttest_dzieci_means_B[grupa_B_wspolna_posttest_dr],dane_posttest_rodzice_means_B[grupa_B_wspolna_posttest_dr],paired = TRUE)

#POSTTEST, K
grupa_K_wspolna_posttest_dr <- intersect(names(dane_posttest_dzieci_means_K),names(dane_posttest_rodzice_means_K))
grupa_K_wspolna_posttest_dr
length(grupa_K_wspolna_posttest_dr)
t.test(dane_posttest_dzieci_means_K[grupa_K_wspolna_posttest_dr],dane_posttest_rodzice_means_K[grupa_K_wspolna_posttest_dr],paired = TRUE)

#Wykres dzieci
plotDaneB <- c("pretest" = mean(dane_pretest_dzieci_means_B), "posttest" = mean(dane_posttest_dzieci_means_B))
plotDaneB
names(plotDaneB)
plotDaneK <- c("pretest" = mean(dane_pretest_dzieci_means_K),"posttest" = mean(dane_posttest_dzieci_means_K))
plotDaneK

par(oma = c(1, 0, 0, 0), mar = c(3, 7, 2, 2)) 
plot(plotDaneB, type="b", xlab = "", ylab = "poziom umiejętności", xlim=c(0.75,2.25), ylim=c(2.9,3.6), xaxt="n", pch=19)
#lines(plotDaneB, type = "l")
points(plotDaneK, type = "b", pch=1)
#lines(plotDaneK, type = "l")
axis(1, at=1:2, tick=1, labels=names(plotDaneB))

#Wykres rodzice
plotDaneB <- c("pretest" = mean(dane_pretest_rodzice_means_B), "posttest" = mean(dane_posttest_rodzice_means_B))
plotDaneB
names(plotDaneB)
plotDaneK <- c("pretest" = mean(dane_pretest_rodzice_means_K),"posttest" = mean(dane_posttest_rodzice_means_K))
plotDaneK

par(oma = c(1, 0, 0, 0), mar = c(3, 7, 2, 2)) 
plot(plotDaneB, type="b", xlab = "", ylab = "poziom umiejętności", xlim=c(0.75,2.25), ylim=c(2.5,3.5), xaxt="n", pch=19)
#lines(plotDaneB, type = "l")
points(plotDaneK, type = "b", pch=1)
#lines(plotDaneK, type = "l")
axis(1, at=1:2, tick=1, labels=names(plotDaneB))

#Rodzice vs dzieci

#cały pretest (niezależne)
shapiro.test(dane_pretest_dzieci_means)
shapiro.test(dane_pretest_rodzice_means)
t.test(dane_pretest_dzieci_means, dane_pretest_rodzice_means, paired = FALSE)
plotDanePretest <- c("dzieci" = mean(dane_pretest_dzieci_means), "rodzice" = mean(dane_pretest_rodzice_means))
barplot(plotDanePretest)

#pretest, B - zależna
plotDanePretestB <- c(
  "dzieci" = mean(dane_pretest_dzieci_means_B[grupa_B_wspolna_pretest_dr]),
  "rodzice" = mean(dane_pretest_rodzice_means_B[grupa_B_wspolna_pretest_dr]))
barplot(plotDanePretestB)


#posttest, B - zależna
plotDanePosttestB <- c(
  "dzieci" = mean(dane_posttest_dzieci_means_B[grupa_B_wspolna_posttest_dr]),
  "rodzice" = mean(dane_posttest_rodzice_means_B[grupa_B_wspolna_posttest_dr]))
barplot(plotDanePosttestB)

#pretest, K - zależna
plotDanePretestK <- c(
  "dzieci" = mean(dane_pretest_dzieci_means_K[grupa_K_wspolna_pretest_dr]),
  "rodzice" = mean(dane_pretest_rodzice_means_K[grupa_K_wspolna_pretest_dr]))
plotDanePretestK
barplot(plotDanePretestK)

#posttest, K - zależna
plotDanePosttestK <- c(
  "dzieci" = mean(dane_posttest_dzieci_means_K[grupa_K_wspolna_posttest_dr]),
  "rodzice" = mean(dane_posttest_rodzice_means_K[grupa_K_wspolna_posttest_dr]))
barplot(plotDanePosttestK)
