PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Data Science 2 - NMFP436
Anglický název: Data Science 2
Zajišťuje: Katedra pravděpodobnosti a matematické statistiky (32-KPMS)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2021
Semestr: letní
E-Kredity: 5
Rozsah, examinace: letní s.:2/2, Z+Zk [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: angličtina, čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Garant: RNDr. Václav Kozmík, Ph.D.
doc. RNDr. Michal Pešta, Ph.D.
Marek Teller
Třída: M Mgr. FPM
M Mgr. FPM > Povinně volitelné
M Mgr. PMSE
M Mgr. PMSE > Povinně volitelné
Kategorizace předmětu: Informatika > Aplikační software
Matematika > Pravděpodobnost a statistika
Je prerekvizitou pro: NMFP556
Anotace -
Poslední úprava: doc. RNDr. Martin Branda, Ph.D. (11.12.2020)
Nedílnou součástí analýzy velkých dat je v dnešní době strojové učení. Strojové učení se hojně využívá a dosahuje úspěchů při řešení komplexních úloh v mnoha oborech. Tento kurz slouží jako úvod do základních principů strojového učení a jeho využití. Představí několik nejpoužívanějších metod jako jsou rozhodovací stromy nebo neuronové sítě, které se následně budou implementovat na cvičení v programovacím jazyce Python. Důraz bude kladen na zpracování a analýzu reálných dat společně s interpretací výsledků.
Cíl předmětu -
Poslední úprava: RNDr. Jitka Zichová, Dr. (06.05.2021)

Úvod do základních principů strojového učení a jeho využití.

Podmínky zakončení předmětu -
Poslední úprava: RNDr. Václav Kozmík, Ph.D. (09.02.2022)

Detaily jsou na webové stránce: https://www2.karlin.mff.cuni.cz/~kozmikk/DS2.php

Literatura -
Poslední úprava: RNDr. Václav Kozmík, Ph.D. (11.12.2020)

Yoshua Bengio, Ian Goodfellow, Aaron Courville: Deep learning, MIT Press, In preparation.

Jürgen Schmidhuber: Deep learning in neural networks: An overview, Neural networks 61 (2015): 85-117.

Friedman, J. H. (March 1999): Stochastic Gradient Boosting, Computational Statistics and Data Analysis, vol. 38, pp. 367-378

Metody výuky -
Poslední úprava: RNDr. Jitka Zichová, Dr. (06.05.2021)

Přednáška + cvičení.

Požadavky ke zkoušce -
Poslední úprava: RNDr. Václav Kozmík, Ph.D. (21.04.2022)

Zkouška bude probíhat formou řešení praktické úlohy v jazyce Python a diskuze nad zvoleným algoritmem, teoretických základech a výsledcích na konkrétním problému. Studenti dostanou k dispozici datovou sadu a popis problému, který je potřeba prediktivním modelem vyřešit.

Sylabus -
Poslední úprava: RNDr. Václav Kozmík, Ph.D. (11.12.2020)

Náplň předmětu:

• úvod do strojového učení, motivace, příklady využití

• obecné postupy ve strojovém učení: rozdělení dat do trénovací a validační množiny, over-fitting, regularizace

• metody využívající rozhodovací stromy: rozhodovací stromy, náhodné lesy, gradientní boosting

• metody požívající neuronové sítě: jednoduché neuronové sítě, konvoluční neuronové sítě, rekurentní neuronové sítě

• shluková analýza – supervised vs unsupervised

• ostatní klasifikační metody – metoda opěrných nadrovin, naivní bayseovský klasifikátor

Náplň cvičení:

• cvičení bude probíhat na počítačích a bude se využívat jazyk Python

• jednotlivé metody strojového učení budeme aplikovat v praxi na reálných datech

Vstupní požadavky - angličtina
Poslední úprava: doc. Ing. Marek Omelka, Ph.D. (19.11.2021)

Necessary:

  • Basic calculus: derivatives, integrals, Taylor expansion, etc.
  • Basic probability and statistics: probability distributions, central limit theorem, statistical tests and hypotheses, Fisher information, maximum likelihood estimators
  • Basic programming skills (in any language)

Good to know:

  • Python: some basics will be covered, but can be challenging if the student has no experience with Python

 
Univerzita Karlova | Informační systém UK