Poslední úprava: doc. Dipl.-Math. Erik Jurjen Duintjer Tebbens, Ph.D. (14.09.2013)
Tento předmět se věnuje statistickým metodám založených na maticových výpočtech, kde efektivní použití metod z numerické lineární algebry je rozhodující. Hlavní důraz je kladen na výběr a pochopení metod, které mají nízké výpočetní a paměťové nároky a jsou pokud možno stabilní a spolehlivé.
Z počátku se výuka zaměří na statistické úlohy spojené s maticovým rozkladem SVD jako PCA, regrese, dimension reduction a small sample size problem (zejména v případě řídkých dat), pattern recognition a podobné klasifikační úlohy či problémy z oblastí data mining. V další výuce se budeme věnovat nezáporným maticovým rozkladům použitým například v text mining a výpočtům z numerické lineární algebry, které slouží k řešení problému page ranking pro internetové vyhledávače.
Poslední úprava: doc. Dipl.-Math. Erik Jurjen Duintjer Tebbens, Ph.D. (14.09.2013)
This course focuses on statistical methods based on matrix computations where the effective application of methods of numerical linear algebra is crucial. The main emphasis is on understanding and selecting methods that have low computational and memory requirements, and are if possible stable and reliable.
The first part of the course will concentrate on statistical tasks associated with the matrix decomposition SVD, like PCA, regression, dimension reduction and the small sample size problem (especially in the case of sparse data), pattern recognition and similar classification tasks or problems from the area of data mining. In the next part we will focus on non-negative matrix decompositions used for example in text mining and on computations of numerical linear algebra that are used to solve the page ranking problem for search engines.
Podmínky zakončení předmětu -
Poslední úprava: doc. RNDr. Václav Kučera, Ph.D. (15.01.2019)
Zápočet je za úspěšné zpracování úlohy v Matlabu. Úloha je podobná úlohám probraným na cvičení.
Poslední úprava: doc. Dipl.-Math. Erik Jurjen Duintjer Tebbens, Ph.D. (30.05.2018)
The credit test consists of succesful implementation of an exercise in Matlab. The exercise is similar to what has been done during the regular exercises of the course.
Literatura -
Poslední úprava: doc. RNDr. Václav Kučera, Ph.D. (15.01.2019)
ELDEN, L.: Matrix Methods in Data Mining and Pattern Recognition, Fundamentals of Algorithms, 4. Society for Industrial and Applied Mathematics (SIAM), Philadelphia, PA, 2007.
BJORCK, ÅKE: Numerical Methods for Least Squares Problems. Society for Industrial and Applied Mathematics (SIAM), Philadelphia, PA, 1996.
HIGHAM, N., STEWART, G. W.: Numerical Linear Algebra in Statistical Computing. The state of the art in numerical analysis (Birmingham, 1986), Inst. Math. Appl. Conf. Ser. New Ser., 9, Oxford Univ. Press, New York, 1987, pp. 41-57.
DUINTJER TEBBENS, J., SCHLESINGER, P.: Improving Implementation of Linear Discriminant Analysis for the High Dimension/Small Sample Size Problem, Computational Statistics and Data Analysis, 2007, vol. 52, no.1, pp. 423-437.
J. KALINA, J. DUINTJER TEBBENS: Metody pro redukci dimenze v mnohorozměrné statistice a jejich výpočet, to appear in the Informacní bulletin of the Czech Statistical Society, in 2014.
J. DUINTJER TEBBENS, I. HNĚTYNKOVÁ, M. PLEŠINGER, Z. STRAKOŠ and P. TICHÝ: Analysis of Methods for Matrix Computations, Basic Methods (in Czech), Matfyzpress Prague, ISBN 978-80-7378-201-6, first edition, 2012, 328 pp.
Poslední úprava: doc. RNDr. Václav Kučera, Ph.D. (15.01.2019)
ELDEN, L.: Matrix Methods in Data Mining and Pattern Recognition, Fundamentals of Algorithms, 4. Society for Industrial and Applied Mathematics (SIAM), Philadelphia, PA, 2007.
BJORCK, ÅKE: Numerical Methods for Least Squares Problems. Society for Industrial and Applied Mathematics (SIAM), Philadelphia, PA, 1996.
HIGHAM, N., STEWART, G. W.: Numerical Linear Algebra in Statistical Computing. The state of the art in numerical analysis (Birmingham, 1986), Inst. Math. Appl. Conf. Ser. New Ser., 9, Oxford Univ. Press, New York, 1987, pp. 41-57.
DUINTJER TEBBENS, J., SCHLESINGER, P.: Improving Implementation of Linear Discriminant Analysis for the High Dimension/Small Sample Size Problem, Computational Statistics and Data Analysis, 2007, vol. 52, no.1, pp. 423-437.
J. KALINA, J. DUINTJER TEBBENS: Metody pro redukci dimenze v mnohorozměrné statistice a jejich výpočet, to appear in the Informacní bulletin of the Czech Statistical Society, in 2014.
J. DUINTJER TEBBENS, I. HNĚTYNKOVÁ, M. PLEŠINGER, Z. STRAKOŠ and P. TICHÝ: Analysis of Methods for Matrix Computations, Basic Methods (in Czech), Matfyzpress Prague, ISBN 978-80-7378-201-6, first edition, 2012, 328 pp.
Metody výuky -
Poslední úprava: T_KPMS (12.05.2014)
Přednáška + cvičení.
Poslední úprava: T_KPMS (12.05.2014)
Lecture+exercises.
Požadavky ke zkoušce -
Poslední úprava: doc. RNDr. Václav Kučera, Ph.D. (15.01.2019)
Zkouška je písemná, většina otázek je typu multiple-choice až na jednu nebo dvě otázky, kde se vyžaduje podrobný popis. Zkoušena bude přednesená látka.
Poslední úprava: doc. Dipl.-Math. Erik Jurjen Duintjer Tebbens, Ph.D. (30.05.2018)
The exam is written with most questions multiple-choice questions, except for one or two requiring detailed descriptions.
All lectured material will be examinated from.
Sylabus -
Poslední úprava: doc. RNDr. Václav Kučera, Ph.D. (15.01.2019)
1. Numerické vlastnosti SVD a spektrálního rozkladu.
2. PCA a spektrální rozklad.
3. (Multi)-Lineární regrese a SVD.
4. Redukce dimenze v mnohorozměrné statistice.
5. Pattern recognition a další klasifikační úlohy.
6. Nezáporné maticové rozklady.
7. Page ranking problem.
Poslední úprava: doc. RNDr. Václav Kučera, Ph.D. (19.12.2018)
1. Numerical properties of the SVD and spectral decomposition.
2. PCA and the spectral decomposition.
3. (Multi)-linear regression and the SVD.
4. Dimension reduction in high-dimensional statistics.
5. Pattern recognition and other classification tasks.
6. Nonnegative matrix decompositions.
7. The page ranking problem.
Vstupní požadavky -
Poslední úprava: doc. RNDr. Václav Kučera, Ph.D. (15.01.2019)
Pouze velmi základní znalosti lineární algebry - další zejména numerické znalosti budou probrány během výuky.
Poslední úprava: doc. Dipl.-Math. Erik Jurjen Duintjer Tebbens, Ph.D. (30.05.2018)
Only very basic knowledge of linear algebra is required - further knowledge, in particular concerning numerics, is lectured during the course.