PředmětyPředměty(verze: 964)
Předmět, akademický rok 2024/2025
   Přihlásit přes CAS
Základy analýzy dat - NMMB333
Anglický název: Introduction to data analysis
Zajišťuje: Katedra algebry (32-KA)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2020
Semestr: zimní
E-Kredity: 5
Rozsah, examinace: zimní s.:2/2, Z+Zk [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Garant: RNDr. Pavel Charamza, CSc.
Vyučující: RNDr. Pavel Charamza, CSc.
Mgr. Michal Nožička
Třída: M Mgr. MMIB
M Mgr. MMIB > Povinně volitelné
Kategorizace předmětu: Matematika > Matematika, Algebra, Diferenciální rovnice, teorie potenciálu, Didaktika matematiky, Diskrétní matematika, Matematická ekonomie a ekonometrie, Předměty širšího základu, Finanční a pojistná matematika, Funkční analýza, Geometrie, Předměty obecného základu, , Reálná a komplexní analýza, Matematika, Matematické modelování ve fyzice, Numerická analýza, Optimalizace, Pravděpodobnost a statistika, Topologie a kategorie
Anotace -
Kurz je zaměřen na standardní metody analýzy dat včetně moderních trendů zpracování velkých datových souborů metodami strojového učení. Modelování nad reálnými daty v prostředí jazyka R.
Poslední úprava: Žemlička Jan, doc. Mgr. et Mgr., Ph.D. (09.05.2018)
Podmínky zakončení předmětu -

Předmět je zakončen ústní zkouškou.

Poslední úprava: Žemlička Jan, doc. Mgr. et Mgr., Ph.D. (10.06.2019)
Literatura -

Zvára Karel: Regresní analýza, Academia 1989

Hebák, Hustopecký: Vícerozměrné statistické metody 1, 2, 3, Informatorium, 2007

Kolaczyk, Csardi: Statistical Analysis of Network Data with R, Springer, 2014

Munzert, Rubba, Meissner, Nyhuis: Automated Data Collection with R, Wiley, 2015

Poslední úprava: Žemlička Jan, doc. Mgr. et Mgr., Ph.D. (09.05.2018)
Požadavky ke zkoušce -

Zkouška má ústní formu. Její požadavky odpovídají obsahu přednesené látky.

Poslední úprava: Žemlička Jan, doc. Mgr. et Mgr., Ph.D. (10.06.2019)
Sylabus -

1) Základy lineární regrese, logistické regrese, lasso regrese, hřebenové regrese, principy testování hypotéz, test podílem věrohodností, stepwise algoritmy

2) Základy vícerozměrné statistiky - metoda hlavních komponent, faktorová analýza, shluková analýza

3) Míry diskriminace - Kolmogorov Smirnov, Gini koeficient, Somer’s d

4) Principy back testu, cross validace a bootstrappingu

5) Regresní stromy, náhodné lesy

6) Gradient boosting

7) Bayesovské sítě, neuronové sítě

8) Lineární optimalizace, Support vector machine

Cvičení: Základy programování v prostředí R, praktické ukázky práce s daty

Poslední úprava: Žemlička Jan, doc. Mgr. et Mgr., Ph.D. (09.05.2018)
 
Univerzita Karlova | Informační systém UK