Pokročilejší zájemci o korpusovou lingvistiku, kteří absolvovali libovolný základní seminář práce s korpusy, mohou
v rámci tohoto semináře prohloubit svoje znalosti statistického zpracování dat. Kurs je zaměřen jak na statistickou
teorii (zejména otázky týkající se korpusové lingvistiky a specifických rozdělení jazykových dat) i na praktické
zvládnutí nástrojů na provádění výpočtu (zejm. R). Kurs předpokládá uživatelskou znalost práce s PC.
Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (12.05.2022)
More advanced students of corpus linguistics, who have already participated in any basic corpus linguistic
seminar, can use this course to deepen their competence in statistical data analysis. The course focuses on the
statistical theory (in particular issues of corpus linguistics and specific distributions of language data) as well as on
relevant computational skills for data analytics using R. The course requires common computer user skills (no
explicit programming background).
Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (12.05.2022)
Podmínky zakončení předmětu -
aktivní účast na hodinách (přípustné jsou 3 nepřítomnosti)
Poslední úprava: Cinková Silvie, Mgr., Ph.D. (22.05.2023)
active participation in the lessons (max 3 absences)
Any individual exceptions are up to the teachers.
Poslední úprava: Cinková Silvie, Mgr., Ph.D. (22.05.2023)
Literatura -
Baayen, H. R.: Analyzing Linguistic Data, Cambridge University Press, Cambridge 2008.
Baayen, H. R.: Word Frequency Distributions. Kluwer Academic Publishers. Dordrecht/Boston/London 2010.
Bartoň, T. - Cvrček, V. - Čermák, F. - Jelínek, T. - Petkevič, V. (2009): Statistiky češtiny. Nakladatelství Lidové
noviny, Praha 2009.
Gries, S. Th.: Quantitative Corpus Linguistics with R, Routledge 2009.
Gries, S. Th.: Statistics for Linguistics with R. A Practical Introduction. Mouton De Gruyter 2013 (2nd revised edition).
Oakes, M. P.: Statistics for Corpus Linguistics. Edinburgh University Press, Edinburgh 1998.
Volín, J. (2007): Statistické metody ve fonetickém výzkumu. Praha: Epocha.
Poslední úprava: Cinková Silvie, Mgr., Ph.D. (22.05.2023)
Baayen, H. R.: Analyzing Linguistic Data, Cambridge University Press, Cambridge 2008.
Baayen, H. R.: Word Frequency Distributions. Kluwer Academic Publishers. Dordrecht/Boston/London 2010.
Bartoň, T. - Cvrček, V. - Čermák, F. - Jelínek, T. - Petkevič, V. (2009): Statistiky češtiny. Nakladatelství Lidové
noviny, Praha 2009.
Gries, S. Th.: Quantitative Corpus Linguistics with R, Routledge 2009.
Gries, S. Th.: Statistics for Linguistics with R. A Practical Introduction. Mouton De Gruyter 2013 (2nd revised edition).
Oakes, M. P.: Statistics for Corpus Linguistics. Edinburgh University Press, Edinburgh 1998.
Volín, J. (2007): Statistické metody ve fonetickém výzkumu. Praha: Epocha.
Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (12.05.2022)
Sylabus -
1. Témata korpusových studií, relevance kvantitativních metod v lingvistice, stanovení hypotézy
2. Deskriptivní statistika - střední hodnota, disperze
3. Typy pravděpodobnostních rozdělení
4. Inferenční statistika
5. Korelace a regrese
6. Faktorová analýza a clusteringové metody
7. ANOVA
Poslední úprava: Cinková Silvie, Mgr., Ph.D. (22.05.2023)
1. Typical topics of corpus studies, relevance of quantitative methods in linguistics, hypothesis formulation
2. Descriptive statistics - central tendency, dispersion
3. Types of pobability distributions
4. Inferential statistics
5. Correlation and regression
6. Factor analysis and clustering methods
7. ANOVA
Poslední úprava: Cinková Silvie, Mgr., Ph.D. (22.05.2023)