Kiedy model jest głęboki?
Głębokie vs. „płytkie” modele, dlaczego głębokość ma znaczenie?
Modele hierarchiczne i uczenie się reprezentacji wiedzy
Przykładowe zastosowania: MNIST, CIFAR, ASR, …
Modele end-to-end
Problemy uczenia głębokich sieci: niestabilny gradient, przeuczenie, koszt pamięci (ilość parametrów uczenia), koszt czasu treningu (duże dane)
Głębokie sieci jednokierunkowe (DNN)
Sieci z jednostkami ReLU, modyfikacje ReLU (PReLU, ELU, ReLU6), Maxout - przykłady zastosowań
Algorytm uczenia SGD z momentem Nesterova, AdaGrad, RMSProp, Adam, AdaDelta
Do poczytania: