Kiedy model jest głęboki?
Głębokie vs. „płytkie” modele, dlaczego głębokość ma znaczenie?
Modele hierarchiczne i uczenie się reprezentacji wiedzy
Przykładowe zastosowania: MNIST, CIFAR, ASR,
Modele end-to-end
Problemy uczenia głębokich sieci: niestabilny gradient, przeuczenie, koszt pamięci (ilość parametrów uczenia), koszt czasu treningu (duże dane)
Głębokie sieci MLP (DNN)
Sieci z jednostkami ReLU, Maxout - przykłady zastosowań
Funkcja kosztu CrossEntropy + softmax w zastosowaniu do klasyfikacji
Algorytm uczenia Stochastic Gradient Descent (SGD) i inne (Adam, AdaGrad, moment Nesterov'a …)
Do poczytania: