PředmětyPředměty(verze: 964)
Předmět, akademický rok 2024/2025
   Přihlásit přes CAS
Data Science 2 - NMFP436
Anglický název: Data Science 2
Zajišťuje: Katedra pravděpodobnosti a matematické statistiky (32-KPMS)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2024
Semestr: letní
E-Kredity: 5
Rozsah, examinace: letní s.:2/2, Z+Zk [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: angličtina, čeština
Způsob výuky: prezenční
Garant: RNDr. Václav Kozmík, Ph.D.
doc. RNDr. Michal Pešta, Ph.D.
Vyučující: RNDr. Karel Kozmík
RNDr. Václav Kozmík, Ph.D.
Mgr. Ondřej Týbl, Ph.D.
Třída: M Mgr. FPM
M Mgr. FPM > Povinně volitelné
M Mgr. PMSE
M Mgr. PMSE > Povinně volitelné
Kategorizace předmětu: Informatika > Aplikační software
Matematika > Pravděpodobnost a statistika
Je prerekvizitou pro: NMFP556
Anotace -
Nedílnou součástí analýzy velkých dat je v dnešní době strojové učení. Strojové učení se hojně využívá a dosahuje úspěchů při řešení komplexních úloh v mnoha oborech. Tento kurz slouží jako úvod do základních principů strojového učení a jeho využití. Představí několik nejpoužívanějších metod jako jsou rozhodovací stromy nebo neuronové sítě, které se následně budou implementovat na cvičení v programovacím jazyce Python. Důraz bude kladen na zpracování a analýzu reálných dat společně s interpretací výsledků.
Poslední úprava: Branda Martin, doc. RNDr., Ph.D. (11.12.2020)
Cíl předmětu -

Úvod do základních principů strojového učení a jeho využití.

Poslední úprava: Zichová Jitka, RNDr., Dr. (06.05.2021)
Podmínky zakončení předmětu -

Detaily jsou na webové stránce: https://www2.karlin.mff.cuni.cz/~kozmikk/DS2.php

Poslední úprava: Kozmík Václav, RNDr., Ph.D. (09.02.2022)
Literatura -

Yoshua Bengio, Ian Goodfellow, Aaron Courville: Deep learning, MIT Press, In preparation.

Jürgen Schmidhuber: Deep learning in neural networks: An overview, Neural networks 61 (2015): 85-117.

Friedman, J. H. (March 1999): Stochastic Gradient Boosting, Computational Statistics and Data Analysis, vol. 38, pp. 367-378

Poslední úprava: Kozmík Václav, RNDr., Ph.D. (11.12.2020)
Metody výuky -

Přednáška + cvičení.

Poslední úprava: Zichová Jitka, RNDr., Dr. (06.05.2021)
Požadavky ke zkoušce -

Zkouška bude probíhat formou řešení praktické úlohy v jazyce Python a diskuze nad zvoleným algoritmem, teoretických základech a výsledcích na konkrétním problému. Studenti dostanou k dispozici datovou sadu a popis problému, který je potřeba prediktivním modelem vyřešit.

Poslední úprava: Kozmík Václav, RNDr., Ph.D. (21.04.2022)
Sylabus -

Náplň předmětu:

• úvod do strojového učení, motivace, příklady využití

• obecné postupy ve strojovém učení: rozdělení dat do trénovací a validační množiny, over-fitting, regularizace

• metody využívající rozhodovací stromy: rozhodovací stromy, náhodné lesy, gradientní boosting

• metody požívající neuronové sítě: jednoduché neuronové sítě, konvoluční neuronové sítě, rekurentní neuronové sítě

• shluková analýza – supervised vs unsupervised

• ostatní klasifikační metody – metoda opěrných nadrovin, naivní bayseovský klasifikátor

Náplň cvičení:

• cvičení bude probíhat na počítačích a bude se využívat jazyk Python

• jednotlivé metody strojového učení budeme aplikovat v praxi na reálných datech

Poslední úprava: Kozmík Václav, RNDr., Ph.D. (11.12.2020)
Vstupní požadavky - angličtina

Necessary:

  • Basic calculus: derivatives, integrals, Taylor expansion, etc.
  • Basic probability and statistics: probability distributions, central limit theorem, statistical tests and hypotheses, Fisher information, maximum likelihood estimators
  • Basic programming skills (in any language)

Good to know:

  • Python: some basics will be covered, but can be challenging if the student has no experience with Python

Poslední úprava: Omelka Marek, doc. Ing., Ph.D. (19.11.2021)
 
Univerzita Karlova | Informační systém UK