Předmět je určen POUZE pro studenty v Programu EM LCT, viz http://ufal.mff.cuni.cz/lct.html. Cílem semináře je představit základní pravděpodobnostní a statistické principy, postupy a metody, které se prakticky využívají při řešení úloh komputační lingvistiky (zpracování přirozeného jazyka). Podstatnou částí kurzu je aktivní práce s daty a seznámení s postupy pro vypracování úloh v R. Po dohodě může část semináře proběhnout čtením a studiem vybraných materiálů.
Poslední úprava: SLEZA (22.05.2007)
ONLY for students in EM Program in LCT, see http://ufal.mff.cuni.cz/lct.html. The aim of the course is to introduce elementary probabilistic and statistical principles, techniques and methods which are used in solving computational linguistics (natural language processing) tasks. An essential part of the course is active work with data and introduction to workflow in R while solving a given task. A part of the course will consist of individual study of mutually agreed selected materials.
Poslední úprava: SLEZA (22.05.2007)
Podmínky zakončení předmětu -
Student musí pravidelně docházet na výuku, odevzdat uložené domácí úkoly a úspěšně složit písemný test na konci semestru. Testovány jsou jak teoretické, tak praktické znalosti (statistické výpočty v R).
Poslední úprava: Holub Martin, RNDr., Ph.D. (02.12.2019)
Students should regularly attend the classes and pass a written test during the term and/or assignments of given tasks in R. Both theoretical knowledge and practical skills will be tested.
Poslední úprava: Holub Martin, RNDr., Ph.D. (02.12.2019)
Literatura -
Sheldon M. Ross: A First Course In Probability. (7th Ed.) Prentice Hall, 2005.
Gonick, Larry and Woollcott Smith. The Cartoon Guide to Statistics. Harper Resource. 2005.
Poslední úprava: Holub Martin, RNDr., Ph.D. (02.12.2019)
Sheldon M. Ross: A First Course In Probability. (7th Ed.) Prentice Hall, 2005.
Gonick, Larry and Woollcott Smith. The Cartoon Guide to Statistics. Harper Resource. 2005.
Poslední úprava: Holub Martin, RNDr., Ph.D. (15.10.2017)
Sylabus -
matematická pravděpodobnost, definice a její počítání, Bayesův vztah
náhodná veličina (diskrétní i spojité) a její pravděpodobnostní rozdělení
distribuční a kvantilová funkce, hustota
statistická nezávislost
střední hodnota a rozptyl
vlastnosti binomického a normálního rozdělení
náhodný výběr
parametry rozdělení, odhadování parametrů, t-test
statistické testování hypotéz, kritické hodnoty
kontingenční tabulky a testy v kontingenčních tabulkách
chi-kvadrát rozdělení a testy na něm založené
entropie, podmíněná entropie, vzájemná informace
základy programování v systému R (www.r-project.org)
Poslední úprava: Holub Martin, RNDr., Ph.D. (15.10.2017)
mathematical probability, its definition and calculating
random variable (discrete and continuos) and its probability distribution
distribution function, quantile function, density
statistical independence
expected value and variance
properties of binomial and normal distributions
random sampling
parameters of distributions, parameter estimating, t-test
statistical hypothesis testing, critical values
contingency tables, hypothesis testing in contingency tables
chi-square distribution, chi-square tests
entropy, conditional entropy, mutual information
basics of programming in R system (www.r-project.org)
Poslední úprava: Holub Martin, RNDr., Ph.D. (15.10.2017)