PředmětyPředměty(verze: 964)
Předmět, akademický rok 2024/2025
   Přihlásit přes CAS
Teoretické základy statistického vyhodnocování jazykových dat v R - NPFL137
Anglický název: Theory of Statistical Analysis in R for Linguists
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2024
Semestr: zimní
E-Kredity: 2
Rozsah, examinace: zimní s.:2/0, Zk [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Kompetence: critical thinking, data literacy
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Garant: Mgr. Silvie Cinková, Ph.D.
Vyučující: Mgr. Silvie Cinková, Ph.D.
Třída: DS, matematická lingvistika
Informatika Mgr. - Matematická lingvistika
Kategorizace předmětu: Informatika > Počítačová a formální lingvistika
Neslučitelnost : NPFL111
Záměnnost : NPFL111
Je neslučitelnost pro: NPFL111
Je záměnnost pro: NPFL111
Anotace -
Pokročilejší zájemci o korpusovou lingvistiku, kteří absolvovali libovolný základní seminář práce s korpusy, mohou v rámci tohoto semináře prohloubit svoje znalosti statistického zpracování dat. Kurs je zaměřen jak na statistickou teorii (zejména otázky týkající se korpusové lingvistiky a specifických rozdělení jazykových dat) i na praktické zvládnutí nástrojů na provádění výpočtu (zejm. R). Kurs předpokládá uživatelskou znalost práce s PC.
Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (12.05.2022)
Podmínky zakončení předmětu -
  • aktivní účast na hodinách (přípustné jsou 3 nepřítomnosti)

Poslední úprava: Cinková Silvie, Mgr., Ph.D. (22.05.2023)
Literatura -

Baayen, H. R.: Analyzing Linguistic Data, Cambridge University Press, Cambridge 2008.

Baayen, H. R.: Word Frequency Distributions. Kluwer Academic Publishers. Dordrecht/Boston/London 2010.

Bartoň, T. - Cvrček, V. - Čermák, F. - Jelínek, T. - Petkevič, V. (2009): Statistiky češtiny. Nakladatelství Lidové

noviny, Praha 2009.

Gries, S. Th.: Quantitative Corpus Linguistics with R, Routledge 2009.

Gries, S. Th.: Statistics for Linguistics with R. A Practical Introduction. Mouton De Gruyter 2013 (2nd revised edition).

Oakes, M. P.: Statistics for Corpus Linguistics. Edinburgh University Press, Edinburgh 1998.

Volín, J. (2007): Statistické metody ve fonetickém výzkumu. Praha: Epocha.

Poslední úprava: Cinková Silvie, Mgr., Ph.D. (22.05.2023)
Sylabus -

1. Témata korpusových studií, relevance kvantitativních metod v lingvistice, stanovení hypotézy

2. Deskriptivní statistika - střední hodnota, disperze

3. Typy pravděpodobnostních rozdělení

4. Inferenční statistika

5. Korelace a regrese

6. Faktorová analýza a clusteringové metody

7. ANOVA

Poslední úprava: Cinková Silvie, Mgr., Ph.D. (22.05.2023)
 
Univerzita Karlova | Informační systém UK