Wprowadzanie do Data Mining

Zajęcia odbywają się w semestrze letnim 2019/2020 w poniedziałek godz. 10-12 w sali PK2

Zaliczenie zajęć odbywa się na podstawie rozwiązań zadań z laboratoriów.

  • Robert Layton, Learning Data Mining with Python, 2015 (2017 wydanie 2) - dostęp on-line z binlioteki z sieci UMK
  • Pang-Ning Tan, Michael Steinbach, Anuj Karpatne, Introduction to Data Mining (Second Edition), WWW
  1. Przegląd metod Data Mining
  2. Szybki wstęp do python, jupyter, numpy, pandas, matlibplot, scikit-learn
  3. Preprocesing, statystyki danych, wizualizacja
  4. Regresja
    • Liniowa oraz wielomianowa
    • underfitting/overfitting
  5. Klasyfikacja i ocena klasyfikatorów
    • kNN
    • drzewa decyzyjne
    • SVM
    • kroswalidacja
  6. Analiza skupień
    • k-means
  7. Przetwarzanie obrazów
  8. text mining
  9. analiza szeregów czasowych
  10. wykrywanie anomalii, braki w danych, dane odstające

Na potrzeby zajęć uruchomiony jest serwer z działającym notatnikiem jupyter.
Adres serwera notatnika: http://panda.fizyka.umk.pl:8886
Serwer dostępny jest w ramach sieci LAN wydziału. Dostęp spoza sieci wydziałowej jest możliwy dzięki VPN.