Poslední úprava: doc. Mgr. Robert Šámal, Ph.D. (01.06.2018)
Přednášky uvedou do možností programovacích nástrojů pro dobývání znalostí. V rámci semináře studenti
postupně zpracují analýzu konkrétní větší datové sady a odevzdají jako semestrální práci.
Poslední úprava: doc. Mgr. Robert Šámal, Ph.D. (01.06.2018)
Lectures introduce to machine learning tools and library functions usage. Participants of the seminar analyze a
given data set and submit their results as a seminar work.
Cíl předmětu -
Poslední úprava: Mgr. Marta Vomlelová, Ph.D. (14.05.2021)
Cílem předmětu je získat praktické zkušenosti s dobýváním znalostí. Věnuje se více přípravě dat, může předcházet přednášce Úvod do strojového učení.
Poslední úprava: Mgr. Marta Vomlelová, Ph.D. (14.05.2021)
The course provides basic experience with data preprocessing and machine learning algortithms.
Podmínky zakončení předmětu -
Poslední úprava: Mgr. Marta Vomlelová, Ph.D. (04.06.2018)
Pro úspěšné absolvování předmětu je třeba provést analýzu dat, prezentovat výsledky a odevzdat ve formě semestrální práce.
Poslední úprava: doc. Mgr. Robert Šámal, Ph.D. (01.06.2018)
Students have to analyze a given data set, present the results and submit the analysis in a written form.
Literatura -
Poslední úprava: Mgr. Marta Vomlelová, Ph.D. (04.06.2018)
Willi Richert, Luis Pedro Coelho: Building Machine Learning Systems with Python, Packt Publishing 2013
Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: An Introduction to Statistical Learning with Applications in R, Springer 2013
Poslední úprava: doc. Mgr. Robert Šámal, Ph.D. (01.06.2018)
Willi Richert, Luis Pedro Coelho: Building Machine Learning Systems with Python,
Packt Publishing 2013
Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: An Introduction to Statistical Learning with Applications in R, Springer 2013
Sylabus -
Poslední úprava: doc. Mgr. Robert Šámal, Ph.D. (01.06.2018)
Cílem semináře je poskytnout konkrétní zkušenost analýzy dat. V přednáškové části si studenti zopakují a rozšíří dostupné nástroje, v seminární části budeme budou aplikovat metody na konkrétní datovou sadu a sdílet zkušenosti.
Svou analýzu odevzdají ve formě semestrální práce.
Přednášky pokryjí základy pro práci:
grafy (XY - scatterplot, krabicový - boxplot a další možnosti grafického zobrazení),
agregace a statistiky pro skupiny,
tvorba jednoduchých klasifikačních a regresních modelů,
vyhodnocení vzhledem k různým chybovým funkcím,
čištění dat (chybějící a odlehlé hodnoty).
Dle konkrétních analyzovaných dat se dále zaměříme na některá z témat:
časové řady,
převod textu na vektory tfidf,
klastrování a učení pravidel (apriori).
Poslední úprava: doc. Mgr. Robert Šámal, Ph.D. (01.06.2018)
The seminar provides an experience in data analysis. It extends the lecture Introduction to Machine Learning.
Lectures introduce to machine learning tools and library functions usage. Participants of the seminar analyze a given dataset and submit their results as a seminar work.
The lectures cover:
graphs (scatter plot, box plot and basic graphs and graph annotations)
groupby function and group statistics
simple classification and regression models
evaluation with respect to different error functions
ways to identify outliers, missing data handling.
According a specific dataset we may further focus at: