|
|
|
||
The course focuses on spoken corpora: their building, design as well as use. Participants will get acquianted with spoken corpora of Czech and other languages, learn about the methods of data collection, transcription and transcription programs. They will learn how to query the corpora of spoken Czech (ORAL, ORTOFON, DIALEKT, DIALOG) in the KonText interface, on the website dialogy.net and using the SyD tool.
In the hands-on part, we will examine specific features of spoken language based on corpus data. <br> Discussion of selected research articles is an integral part of the course. The course is taught mainly in Czech and therefore requires sufficient proficiency in order to attend Last update: Kopřivová Marie, PhDr. Mgr., Ph.D. (09.02.2024)
|
|
||
Requirements:
2) presenatition of a corpus of spoken language 3) test of skills for use with Czech spoken corpora Last update: Kopřivová Marie, PhDr. Mgr., Ph.D. (09.02.2024)
|
|
||
Readings: Čermáková, A. – Kopřivová, M. (2018): Korpusový výzkum mluveného jazyka na příkladu češtiny a angličtiny: současný stav. SaS 79/2018, č. 3, 217-240 Čmejrková, S. – Jílková, L. – Kaderka, P. (2004): Mluvená čeština v televizních debatách: korpus DIALOG. Slovo a slovesnost, 65, s. 243–269. Hoffmannová, J. – Homoláč, J. – Mrázková, K. (eds.): Syntax mluvené češtiny. Praha: Academia 2019.Hoffmannová, J.: Styl doprovodných dialogů. Jazykovedný časopis, 73, č. 1, 2022, s. 86-100. [pdf] Hoffmannová, J. – Zeman, J.: Výzkum syntaxe mluvené češtiny: vstupní inventarizace problémů. Slovo a slovesnost 78, 2017, 45–66. [pdf] Homoláč, J. – Mareš, P. – Hoffmannová, J. – Jílková, L. – Kopecký, J. – Mrázková, K.: Míšení žánrů, stylů a diskurzů v internetové komunikaci. Praha: Academia 2022. Kopřivová M.: To je hrozný no . ale zas jako jsou kreativní : Evaluativní reakce v každodenní komunikaci. Czech language news, 2022, č. • no. 2022, s. • p. 7-22. ISSN 1095-2950. Kopřivová, M. - Komrsková, Z. Lukeš, D. - Poukarová, P. (2017): Korpus ORAL: sestavení, lemmatizace a morfologické značkování. KGA, 47-67. ISSN 1804-137X. Kopřivová M., Laubeová Z., Lukeš D.: Designing a corpus of Czech monologues: ORATOR v2. Jazykovedný Časopis, 2021, č. • no. 72, s. • p. 520-530. ISSN 0021-5597. Kopřivová M., Laubeová Z., Poukarová P., Lukeš D.: Relevant criteria for selection of spoken data: Theory meets practice. Jazykovedný Časopis, 2019, č. • no. 70, s. • p. 324-335. ISSN 0021-5597. Kopřivová, M. - Waclawičová, M. (eds): Čeština v mluveném korpusu. NLN, Praha 2008. Lukeš D., Kopřivová M., Komrsková Z., Poukarová P.: Pronunciation Variants and ASR of Colloquial Speech: A Case Study on Czech. In Calzolari N., Choukri K., Cieri C., Declerck T., et al.: Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). Miyazaki, European Language Resources Association (ELRA), 2018, s. • p. 2704-2709. ISBN 979-10-95546-00-9. Merkel, S. - Schmidt, T.: Korpora gesprochener Sprache im Netz - eine Umschau. Miller, J. - Weinert, R.: Spontaneous Spoken Language. Syntax and Discourse. Clarendon Press. Oxford 1998. Last update: Kopřivová Marie, PhDr. Mgr., Ph.D. (09.02.2024)
|
|
||
Probíraná témata: 1) Mluvený jazyk a jeho specifika 2) Vytváření mluvených korpusů 3) Typy korpusů mluveného jazyka , korpusy mluvené češtiny 4) Pořizování nahrávek, výběr mluvčích, anonymizace 5) Otázky transkripce (trankripční programy: Transcribere, ELAN, EXMERALDA) 6) Morfologická anotace mluvené češtiny 7) Světové korpusy mluveného jazyka 8) Práce s mluvenými korpusy (ORAL, ORTOFON, DIALEKT – korpusový manažer Kontext) 9) Mluvený jazyk v NLP 10) Specifické jevy mluvené češtiny
Last update: Kopřivová Marie, PhDr. Mgr., Ph.D. (09.02.2024)
|