Machine learning has become a significant data science tool to explore and analyze the geography data. The objectives of the course is to review basic principles of machine learning, critically assess the algorithms, practically design processing workflows, apply quality control procedures and interpret the results.
The analysis are applied on spatial and spatio-temporal geography data. Students will develop their own scripts to practically use the gained knowledge of machine learning within the geoscience applications.
There are no formal prerequisites, but a good knowledge of Python language is necessary.
Last update: Brodský Lukáš, Ing., Ph.D. (03.01.2023)
Metody strojového učení jsou v poslední době nedílnou součástí průzkum a analýzy dat, včetně geografických dat. Cílem předmětu je získání přehledu principů strojového učení, kritické zhodnocení používaných algoritmů, praktický návrh procesních linek, kontrola kvality a interpretace získaných výsledků.
Analýzy dat budou aplikovány na prostorová a časo-prostorová geografická data. Studenti v předmětu samostatně pracují na zadaných projektech aplikace strojového učení. V těchto projektech vytvářejí vlastní skripty v jazyce Python s využitím získaných znalostí a kriticky hodnotí výsledky.
Dobrá znalost jayzka Python je podmínka nutná pro úspěšné absolvování předmětu.
Last update: Brodský Lukáš, Ing., Ph.D. (03.01.2023)
Literature -
Bishop C. M. (2006): Pattern Recognition and Machine Learning, Springer.
Goodfellow, I., Bengio, Y., Courville, A. (2016): Deep Learning, MIT press.
Mehryar, M., Afshin, R., Ameet, T. (2012): Foundations of Machine Learning, MIT press.
Lary, D. J., Alavi, A. H., Gandomi, A. H., Walker, A. L. (2016): Machine learning in geosciences and remote sensing. Geoscience Frontiers, Elsevier.
Last update: Čábelka Miroslav, Ing. (15.01.2020)
Bishop C. M. (2006): Pattern Recognition and Machine Learning, Springer.
Goodfellow, I., Bengio, Y., Courville, A. (2016): Deep Learning, MIT press.
Mehryar, M., Afshin, R., Ameet, T. (2012): Foundations of Machine Learning, MIT press.
Lary, D. J., Alavi, A. H., Gandomi, A. H., Walker, A. L. (2016): Machine learning in geosciences and remote sensing. Geoscience Frontiers, Elsevier.
Last update: Čábelka Miroslav, Ing. (15.01.2020)
Requirements to the exam
All assigments from labs (credits).
Written exam, min. 50% correct.
Last update: Brodský Lukáš, Ing., Ph.D. (15.03.2023)
Syllabus -
1. Introduction to Machine Lerning (linear and non-linear problems) 2. Historical context (development of ML algoritms since 1950) 3. Machine Learning landscape (review of ML types, terminology) 4. Basics of linear algebra & Python data science for Machine Learning (Numpy, Matplotlib, Pandas) 5. Fundamental algorithms (LM, KNN, SVM, DT, ANN, Gradient Descent) 6. Model generalization (training and testing error, components of error, model diagnostics, overfitting, underfitting, model generalization strategies) 7. Model regularization (regularization techniques, regularized linear model, Ridge regression, Lasso, Elastic net, regularizing polynomoial model) 8. Machine Learning project (End-to-end project workflow) 9. Ensemble learning (voting classifier, bagging, stacking, random patches, random subspaces, Random Forest, extra trees, boosting, early stopping) 10. Workign with spatial data in Python (Rasterio, Geopandas, vector-raster combination) 11. Geospatial Artificial Intelligence (spatial dependence, spatial non-stationarity, spatiall cross validation) 12. Introduction to Deep Learning (Pytorch tensors, GPU computing, MLP) 13. Convolutional Neural Networks (spatial data in ANN, CNN idea, CNN elements, CNN loss functions, CNN architectures - FCN, UNet, SegNet)
Last update: Čábelka Miroslav, Ing. (12.06.2024)
1. Úvod do strojového učení (lineární a nelineární problémy) 2. Historické souvislosti (vývoj ML algoritmů od roku 1950) 3. Strojové učení (přehled typů ML, terminologie) 4. Základy lineární algebry a datové vědy v jazyce Python pro strojové učení (Numpy, Matplotlib, Pandas) 5. Základní algoritmy (LM, KNN, SVM, DT, ANN, Algoritmus gradientního sestupu) 6. Generalizace modelu (chyba trénování a testování, složky chyby, diagnostika modelu, overfitting, underfitting, strategie generalizace modelu) 7. Regularizace modelu (regularizační techniky, regularizovaný lineární model, Ridge, Lasso, Elastic net, regularizace polynomického modelu) 8. Projekt strojového učení (end-to-end pracovní postup projektu) 9. Ansámblové učení (hlasovací klasifikátor, bagging, stacking, random patches, random subspaces, Random Forest, extra trees, boosting, předčasné zastavení) 10. Práce s prostorovými daty v Python (Rasterio, Geopandas, kombinace vektorů a rastrů) 11. Geoprostorová umělá inteligence (prostorová závislost, prostorová nestacionarita, prostorová křížová validace) 12. Úvod do hlubokého učení (tenzory v Pytorch, výpočty na GPU, MLP) 13. Konvoluční neuronové sítě (prostorová data v ANN, idea CNN, prvky CNN, ztrátové funkce CNN, architektury CNN: FCN, UNet, SegNet)