Last update: doc. RNDr. Martin Branda, Ph.D. (11.12.2020)
A crucial part of big data analysis is machine learning. Machine learning is widely used and is successful when
solving complex tasks in many fields. This course serves as an introduction to basic machine learning principles
and its use in practice. It presents the most used methods as decision trees or neural networks, which will be
implemented in practicals in Python language. We will focus on analysis of real data and interpretation of the
results.
Last update: doc. RNDr. Martin Branda, Ph.D. (11.12.2020)
Nedílnou součástí analýzy velkých dat je v dnešní době strojové učení. Strojové učení se hojně využívá a dosahuje
úspěchů při řešení komplexních úloh v mnoha oborech. Tento kurz slouží jako úvod do základních principů
strojového učení a jeho využití. Představí několik nejpoužívanějších metod jako jsou rozhodovací stromy nebo
neuronové sítě, které se následně budou implementovat na cvičení v programovacím jazyce Python. Důraz bude
kladen na zpracování a analýzu reálných dat společně s interpretací výsledků.
Aim of the course -
Last update: RNDr. Jitka Zichová, Dr. (06.05.2021)
An introduction to basic machine learning principles and its use in practice.
Last update: RNDr. Jitka Zichová, Dr. (06.05.2021)
Úvod do základních principů strojového učení a jeho využití.
Course completion requirements -
Last update: RNDr. Václav Kozmík, Ph.D. (09.02.2022)
Details can be found on the webpage: https://www2.karlin.mff.cuni.cz/~kozmikk/DS2.php
Last update: RNDr. Václav Kozmík, Ph.D. (09.02.2022)
Detaily jsou na webové stránce: https://www2.karlin.mff.cuni.cz/~kozmikk/DS2.php
Literature -
Last update: RNDr. Václav Kozmík, Ph.D. (11.12.2020)
Yoshua Bengio, Ian Goodfellow, Aaron Courville: Deep learning, MIT Press, In preparation.
Jürgen Schmidhuber: Deep learning in neural networks: An overview, Neural networks 61 (2015): 85-117.
Friedman, J. H. (March 1999): Stochastic Gradient Boosting, Computational Statistics and Data Analysis, vol. 38, pp. 367-378
Last update: RNDr. Václav Kozmík, Ph.D. (11.12.2020)
Yoshua Bengio, Ian Goodfellow, Aaron Courville: Deep learning, MIT Press, In preparation.
Jürgen Schmidhuber: Deep learning in neural networks: An overview, Neural networks 61 (2015): 85-117.
Friedman, J. H. (March 1999): Stochastic Gradient Boosting, Computational Statistics and Data Analysis, vol. 38, pp. 367-378
Teaching methods -
Last update: RNDr. Jitka Zichová, Dr. (06.05.2021)
Lecture + exercises.
Last update: RNDr. Jitka Zichová, Dr. (06.05.2021)
Přednáška + cvičení.
Requirements to the exam -
Last update: RNDr. Václav Kozmík, Ph.D. (21.04.2022)
Exam will include solving a practical task in Python with discussion about selected algorithm, its theoretial background and results achived in the practical task. Student will receive a data set together with a description of the prediction task which needs to be solved.
Last update: RNDr. Václav Kozmík, Ph.D. (21.04.2022)
Zkouška bude probíhat formou řešení praktické úlohy v jazyce Python a diskuze nad zvoleným algoritmem, teoretických základech a výsledcích na konkrétním problému. Studenti dostanou k dispozici datovou sadu a popis problému, který je potřeba prediktivním modelem vyřešit.
Syllabus -
Last update: RNDr. Václav Kozmík, Ph.D. (11.12.2020)
Lectures:
• introduction to machine learning, motivation, examples
• general methods in machine learning: split of dataset to training and validation, over-fitting, regularization
• methods using decision trees: decision trees, random forest, gradient boosting
• metody požívající neuronové sítě: jednoduché neuronové sítě, konvoluční neuronové sítě, rekurentní neuronové sítě
• shluková analýza – supervised vs unsupervised
• ostatní klasifikační metody – metoda opěrných nadrovin, naivní bayseovský klasifikátor
Náplň cvičení:
• cvičení bude probíhat na počítačích a bude se využívat jazyk Python
• jednotlivé metody strojového učení budeme aplikovat v praxi na reálných datech
Entry requirements
Last update: doc. Ing. Marek Omelka, Ph.D. (19.11.2021)
Necessary:
Basic calculus: derivatives, integrals, Taylor expansion, etc.
Basic probability and statistics: probability distributions, central limit theorem, statistical tests and hypotheses, Fisher information, maximum likelihood estimators
Basic programming skills (in any language)
Good to know:
Python: some basics will be covered, but can be challenging if the student has no experience with Python