Thesis (Selection of subject)Thesis (Selection of subject)(version: 385)
Thesis details
   Login via CAS
Klasifikace chyb u studentů češtiny jako cizího jazyka
Thesis title in Czech: Klasifikace chyb u studentů češtiny jako cizího jazyka
Thesis title in English: Error classification in learners of Czech as a foreign language
Key words: žákovské korpusy; čeština jako cizí jazyk; anotace; lexikální zdroje;
English key words: learner corpora; Czech as a foreign language; annotation; lexical resources
Academic year of topic announcement: 2018/2019
Thesis type: dissertation
Thesis language:
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: Mgr. Silvie Cinková, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 16.07.2019
Date of assignment: 16.07.2019
Confirmed by Study dept. on: 04.10.2019
Date and time of defence: 28.06.2024 00:00
Guidelines
Student se seznámí s aktuálně dostupnými žákovskými korpusy pro češtinu a s moderními nástroji . Na základě těchto dat, případně jejich vlastní ruční anotace, případně na základě vlastnoručně vyrobeného datového souboru se student rozhodne pro jeden z následujících okruhů výzkumných otázek:

Jaká je shoda v klasifikaci chyb u učitelů? Které kombinace jazykových jevů ohrožují shodu? Existuje asociace mezi shodou a hodnocenou úrovní jazykového projevu (např. klesá shoda u prací pokročilejších žáků)? Je vyšší, nebo nižší shoda mezi učiteli vs. mezi anotátory žákovských korpusů? Dovolí nám data sestavit soubor chybových tříd, na kterých by shoda byla signifikantně vyšší a použít takovou sadu tříd např. k natrénování chybového klasifikátoru?
Lze škálovat vliv znalosti slovanského jazyka jako L2 u žáků na výskyt různých druhů chyb a jejich kombinací? Z praktického hlediska například: vyplatilo by se přizpůsobit výuku etnicky neslovanským žákům ze zemí bývalého Sovětského Svazu, nebo jim školní ruština pomáhá stejně jako rodilým slovanským mluvčím?

References
Šebesta, K. - Bedřichová, Z. - Šormová, K. - Štindlová, B. - Hrdlička, M. - Hrdličková, T. - Hana, J. - Petkevič, V. - Jelínek, T. - Škodová, S. - Poláčková, M. - Janeš, P. - Lundáková, K. - Skoumalová, H. - Sládek, Š. - Pierscieniak, P. - Toufarová, D. - Richter, M. - Straka, M. - Rosen, A.: CzeSL-SGT: korpus češtiny nerodilých mluvčích s automaticky provedenou anotací, verze 2 z 28. 7. 2014. Ústav Českého národního korpusu FF UK, Praha 2014. Dostupný z WWW: http://www.korpus.cz
Šebesta, K. – Bedřichová, Z. – Hana, J. – Hlaváčková, E. – Hnátková, M. – Hrdlička, M. – Janeš, P. – Jelínek, T. – Křen, M. – Lábus, V. – Lundáková, K. – Petkevič, V. – Pierscieniak, P. – Procházka, P. – Rosen, A. – Skoumalová, H. – Škodová, S. – Šormová, K. – Štindlová, B.: CZESL-PLAIN: akviziční korpus psané češtiny, zvl. přepisů písemných projevů nerodilých mluvčích, verze 2 z 22. 1. 2014. Ústav Českého národního korpusu FF UK, Praha 2012. Dostupný z WWW: http://www.korpus.cz.
BREYER, Yvonne Alexandra, 2011. Corpora in language teaching and learning: potential, evaluation, challenges. Frankfurt am Main: Peter Lang. English corpus linguistics. ISBN 978-3-631-63041-9
CAPEL, Anette, 2010. A1–B2 vocabulary: Insights and issues arising from the English Profile Wordlists project. In: English Profile Journal, 1, E3. doi:10.1017/S2041536210000048
CVRČEK, Václav, Anna ČERMÁKOVÁ a Michal KŘEN, 2016. Nová koncepce synchronních korpusů psané češtiny. Slovo a slovesnost. Praha: Ústav pro jazyk český Akademie věd České republiky, 77(2), 83‒101. ISSN 0037-7031.
ČADSKÁ, Milada, 2006. K metodologickým východiskům a obsahovému zaměření popisu Čeština jako cizí jazyk ‒ Úroveň A2. In: Sborník Asociace učitelů češtiny jako cizího jazyka (AUČCJ) 2005‒2006. Praha: Akropolis ve spolupráci s Asociací učitelů češtiny jako cizího jazyka, 23‒26. ISBN 80-86903-37-0.
ČADSKÁ, M. – BIDLAS, V. – CONFORTIOVÁ, H. – TURZÍKOVÁ, M., 2005. Čeština jako cizí jazyk. Úroveň A2. Praha: Tauris.
GRANGER, Sylviane, 2009. The contribution of learner corpora to second language acquisition and foreign language teaching: A critical evaluation. In: Aijmer, K., Corpora and Language Teaching, Benjamins: Amsterdam and Philadelphia, 2009, p. 13‒32.
HÁDKOVÁ, Marie, 2006. Popis referenční úrovně A1 pro češtinu ‒ může sloužit učiteli?. In: Sborník Asociace učitelů češtiny jako cizího jazyka (AUČCJ) 2005‒2006. Praha: Akropolis ve spolupráci s Asociací učitelů češtiny jako cizího jazyka, 2006, 17‒22. ISBN 80-86903-37-0.
McENERY, Tony a Richard XIAO, 2011. What corpora can offer in language teaching and learning. HINKEL, Eli. Handbook of research in second language teaching and learning, vol. 2. New York: Routledge, s. 364‒380. ISBN 978-0-415-99872-7.
MILTON, James, 2010. The development of vocabulary breadth across the CEFR levels. In: Eurosla Monograhps Series 1. Eurosla, 211–232. ISBN 978-1-4466-6993-8.
SERRJ [Společný evropský referenční rámec pro jazyky: jak se učíme jazykům, jak je vyučujeme a jak v jazycích hodnotíme], 2006. 2. české vyd. Olomouc: Univerzita Palackého. ISBN 80-244-1425-2.
ŠÁRA, M. a kol., 2001. Prahová úroveň – čeština jako cizí jazyk. Strasbourg: Council of Europe
ŠINDELÁŘOVÁ, Jaromíra, 2010. Čeština jako cizí jazyk dle SERR. Metodický portál: inspirace a zkušenosti učitelů[online]. [cit. 2018-02-20]. Dostupné z: <https://clanky.rvp.cz/clanek/c/Z/8143/cestina-jako-cizi-jazyk-dle-serr.html/>


Preliminary scope of work in English
The student will get acquainted with currently available pupil corpora for Czech and with modern corpus tools. On the basis of these data, or their additional manual annotation, alternatively on a new data set, the student decides for one of the following research questions:

1) What is the inter-annotator agreement between teachers in error classification? Which combinations of language phenomena decrease the inter-annotator agreement? Is there an association between the inter-annotator agreement and the efficiency level of the learner (e.g. does the inter-annotator agreement among teachers decrease in essays by more advanced pupils)? Is the inter-annotator agreement different in teachers vs. laymen annotators of learner corpora? Does the data allow us to compile a set of error classes where the inter-annotator agreement among teachers would be significantly higher and use such a set of classes, for example, to train an automatic error classifier?

2) Is it possible to scale the influence of the proficiency in a Slavic language as L2 on the occurrence of various kinds of errors and their combinations? For example, from a practical point of view, would it be worthwhile to adapt the teaching to ethnic non-Slavic learners from former Soviet Union countries, or does their school Russian help them as well as native Slavic speakers?
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html