Kurz je zaměřen na standardní metody analýzy dat včetně moderních trendů zpracování velkých datových
souborů metodami strojového učení. Modelování nad reálnými daty v prostředí jazyka R.
Poslední úprava: Žemlička Jan, doc. Mgr. et Mgr., Ph.D. (09.05.2018)
The lecture covers standard methods of data analysis, including modern
trends of big data analysis using machine learning. Modelling over real
data in the R environment.
Poslední úprava: Žemlička Jan, doc. Mgr. et Mgr., Ph.D. (09.05.2018)
Podmínky zakončení předmětu -
Předmět je zakončen ústní zkouškou.
Poslední úprava: Žemlička Jan, doc. Mgr. et Mgr., Ph.D. (10.06.2019)
Students have to pass oral exam.
Poslední úprava: Žemlička Jan, doc. Mgr. et Mgr., Ph.D. (28.10.2019)
Literatura -
Zvára Karel: Regresní analýza, Academia 1989
Hebák, Hustopecký: Vícerozměrné statistické metody 1, 2, 3, Informatorium, 2007
Kolaczyk, Csardi: Statistical Analysis of Network Data with R, Springer, 2014
Munzert, Rubba, Meissner, Nyhuis: Automated Data Collection with R, Wiley, 2015
Poslední úprava: Žemlička Jan, doc. Mgr. et Mgr., Ph.D. (09.05.2018)
Zvára Karel: Regresní analýza, Academia 1989
Hebák, Hustopecký: Vícerozměrné statistické metody 1, 2, 3, Informatorium, 2007
Kolaczyk, Csardi: Statistical Analysis of Network Data with R, Springer, 2014
Munzert, Rubba, Meissner, Nyhuis: Automated Data Collection with R, Wiley, 2015
Poslední úprava: Žemlička Jan, doc. Mgr. et Mgr., Ph.D. (09.05.2018)
Požadavky ke zkoušce -
Zkouška má ústní formu. Její požadavky odpovídají obsahu přednesené látky.
Poslední úprava: Žemlička Jan, doc. Mgr. et Mgr., Ph.D. (10.06.2019)
Students have to pass oral exam. The requirements for the exam correspond to what has been done during lectures and practicals.
Poslední úprava: Žemlička Jan, doc. Mgr. et Mgr., Ph.D. (28.10.2019)
Sylabus -
1) Základy lineární regrese, logistické regrese, lasso regrese, hřebenové regrese, principy testování hypotéz, test podílem věrohodností, stepwise algoritmy
2) Základy vícerozměrné statistiky - metoda hlavních komponent, faktorová analýza, shluková analýza
3) Míry diskriminace - Kolmogorov Smirnov, Gini koeficient, Somer’s d
4) Principy back testu, cross validace a bootstrappingu
5) Regresní stromy, náhodné lesy
6) Gradient boosting
7) Bayesovské sítě, neuronové sítě
8) Lineární optimalizace, Support vector machine
Cvičení: Základy programování v prostředí R, praktické ukázky práce s daty
Poslední úprava: Žemlička Jan, doc. Mgr. et Mgr., Ph.D. (09.05.2018)
1) Basics of linear regression, logistic regression, lasso regression, principles of hypotheses testing, likelihood ratio tests, stepwise algorithms