|
|
||
Kurz je zaměřen na standardní metody analýzy dat včetně moderních trendů zpracování velkých datových
souborů metodami strojového učení. Modelování nad reálnými daty v prostředí jazyka R.
Poslední úprava: Žemlička Jan, doc. Mgr. et Mgr., Ph.D. (09.05.2018)
|
|
||
Předmět je zakončen ústní zkouškou. Poslední úprava: Žemlička Jan, doc. Mgr. et Mgr., Ph.D. (10.06.2019)
|
|
||
Zvára Karel: Regresní analýza, Academia 1989 Hebák, Hustopecký: Vícerozměrné statistické metody 1, 2, 3, Informatorium, 2007 Kolaczyk, Csardi: Statistical Analysis of Network Data with R, Springer, 2014 Munzert, Rubba, Meissner, Nyhuis: Automated Data Collection with R, Wiley, 2015 Poslední úprava: Žemlička Jan, doc. Mgr. et Mgr., Ph.D. (09.05.2018)
|
|
||
Zkouška má ústní formu. Její požadavky odpovídají obsahu přednesené látky. Poslední úprava: Žemlička Jan, doc. Mgr. et Mgr., Ph.D. (10.06.2019)
|
|
||
1) Základy lineární regrese, logistické regrese, lasso regrese, hřebenové regrese, principy testování hypotéz, test podílem věrohodností, stepwise algoritmy 2) Základy vícerozměrné statistiky - metoda hlavních komponent, faktorová analýza, shluková analýza 3) Míry diskriminace - Kolmogorov Smirnov, Gini koeficient, Somer’s d 4) Principy back testu, cross validace a bootstrappingu 5) Regresní stromy, náhodné lesy 6) Gradient boosting 7) Bayesovské sítě, neuronové sítě 8) Lineární optimalizace, Support vector machine
Cvičení: Základy programování v prostředí R, praktické ukázky práce s daty Poslední úprava: Žemlička Jan, doc. Mgr. et Mgr., Ph.D. (09.05.2018)
|