Klasifikace chyb u studentů češtiny jako cizího jazyka
Thesis title in Czech: | Klasifikace chyb u studentů češtiny jako cizího jazyka |
---|---|
Thesis title in English: | Error classification in learners of Czech as a foreign language |
Key words: | žákovské korpusy; čeština jako cizí jazyk; anotace; lexikální zdroje; |
English key words: | learner corpora; Czech as a foreign language; annotation; lexical resources |
Academic year of topic announcement: | 2018/2019 |
Thesis type: | dissertation |
Thesis language: | |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | Mgr. Silvie Cinková, Ph.D. |
Author: | hidden![]() |
Date of registration: | 16.07.2019 |
Date of assignment: | 16.07.2019 |
Confirmed by Study dept. on: | 04.10.2019 |
Date and time of defence: | 28.06.2024 00:00 |
Guidelines |
Student se seznámí s aktuálně dostupnými žákovskými korpusy pro češtinu a s moderními nástroji . Na základě těchto dat, případně jejich vlastní ruční anotace, případně na základě vlastnoručně vyrobeného datového souboru se student rozhodne pro jeden z následujících okruhů výzkumných otázek:
Jaká je shoda v klasifikaci chyb u učitelů? Které kombinace jazykových jevů ohrožují shodu? Existuje asociace mezi shodou a hodnocenou úrovní jazykového projevu (např. klesá shoda u prací pokročilejších žáků)? Je vyšší, nebo nižší shoda mezi učiteli vs. mezi anotátory žákovských korpusů? Dovolí nám data sestavit soubor chybových tříd, na kterých by shoda byla signifikantně vyšší a použít takovou sadu tříd např. k natrénování chybového klasifikátoru? Lze škálovat vliv znalosti slovanského jazyka jako L2 u žáků na výskyt různých druhů chyb a jejich kombinací? Z praktického hlediska například: vyplatilo by se přizpůsobit výuku etnicky neslovanským žákům ze zemí bývalého Sovětského Svazu, nebo jim školní ruština pomáhá stejně jako rodilým slovanským mluvčím? |
References |
Šebesta, K. - Bedřichová, Z. - Šormová, K. - Štindlová, B. - Hrdlička, M. - Hrdličková, T. - Hana, J. - Petkevič, V. - Jelínek, T. - Škodová, S. - Poláčková, M. - Janeš, P. - Lundáková, K. - Skoumalová, H. - Sládek, Š. - Pierscieniak, P. - Toufarová, D. - Richter, M. - Straka, M. - Rosen, A.: CzeSL-SGT: korpus češtiny nerodilých mluvčích s automaticky provedenou anotací, verze 2 z 28. 7. 2014. Ústav Českého národního korpusu FF UK, Praha 2014. Dostupný z WWW: http://www.korpus.cz
Šebesta, K. – Bedřichová, Z. – Hana, J. – Hlaváčková, E. – Hnátková, M. – Hrdlička, M. – Janeš, P. – Jelínek, T. – Křen, M. – Lábus, V. – Lundáková, K. – Petkevič, V. – Pierscieniak, P. – Procházka, P. – Rosen, A. – Skoumalová, H. – Škodová, S. – Šormová, K. – Štindlová, B.: CZESL-PLAIN: akviziční korpus psané češtiny, zvl. přepisů písemných projevů nerodilých mluvčích, verze 2 z 22. 1. 2014. Ústav Českého národního korpusu FF UK, Praha 2012. Dostupný z WWW: http://www.korpus.cz. BREYER, Yvonne Alexandra, 2011. Corpora in language teaching and learning: potential, evaluation, challenges. Frankfurt am Main: Peter Lang. English corpus linguistics. ISBN 978-3-631-63041-9 CAPEL, Anette, 2010. A1–B2 vocabulary: Insights and issues arising from the English Profile Wordlists project. In: English Profile Journal, 1, E3. doi:10.1017/S2041536210000048 CVRČEK, Václav, Anna ČERMÁKOVÁ a Michal KŘEN, 2016. Nová koncepce synchronních korpusů psané češtiny. Slovo a slovesnost. Praha: Ústav pro jazyk český Akademie věd České republiky, 77(2), 83‒101. ISSN 0037-7031. ČADSKÁ, Milada, 2006. K metodologickým východiskům a obsahovému zaměření popisu Čeština jako cizí jazyk ‒ Úroveň A2. In: Sborník Asociace učitelů češtiny jako cizího jazyka (AUČCJ) 2005‒2006. Praha: Akropolis ve spolupráci s Asociací učitelů češtiny jako cizího jazyka, 23‒26. ISBN 80-86903-37-0. ČADSKÁ, M. – BIDLAS, V. – CONFORTIOVÁ, H. – TURZÍKOVÁ, M., 2005. Čeština jako cizí jazyk. Úroveň A2. Praha: Tauris. GRANGER, Sylviane, 2009. The contribution of learner corpora to second language acquisition and foreign language teaching: A critical evaluation. In: Aijmer, K., Corpora and Language Teaching, Benjamins: Amsterdam and Philadelphia, 2009, p. 13‒32. HÁDKOVÁ, Marie, 2006. Popis referenční úrovně A1 pro češtinu ‒ může sloužit učiteli?. In: Sborník Asociace učitelů češtiny jako cizího jazyka (AUČCJ) 2005‒2006. Praha: Akropolis ve spolupráci s Asociací učitelů češtiny jako cizího jazyka, 2006, 17‒22. ISBN 80-86903-37-0. McENERY, Tony a Richard XIAO, 2011. What corpora can offer in language teaching and learning. HINKEL, Eli. Handbook of research in second language teaching and learning, vol. 2. New York: Routledge, s. 364‒380. ISBN 978-0-415-99872-7. MILTON, James, 2010. The development of vocabulary breadth across the CEFR levels. In: Eurosla Monograhps Series 1. Eurosla, 211–232. ISBN 978-1-4466-6993-8. SERRJ [Společný evropský referenční rámec pro jazyky: jak se učíme jazykům, jak je vyučujeme a jak v jazycích hodnotíme], 2006. 2. české vyd. Olomouc: Univerzita Palackého. ISBN 80-244-1425-2. ŠÁRA, M. a kol., 2001. Prahová úroveň – čeština jako cizí jazyk. Strasbourg: Council of Europe ŠINDELÁŘOVÁ, Jaromíra, 2010. Čeština jako cizí jazyk dle SERR. Metodický portál: inspirace a zkušenosti učitelů[online]. [cit. 2018-02-20]. Dostupné z: <https://clanky.rvp.cz/clanek/c/Z/8143/cestina-jako-cizi-jazyk-dle-serr.html/> |
Preliminary scope of work in English |
The student will get acquainted with currently available pupil corpora for Czech and with modern corpus tools. On the basis of these data, or their additional manual annotation, alternatively on a new data set, the student decides for one of the following research questions:
1) What is the inter-annotator agreement between teachers in error classification? Which combinations of language phenomena decrease the inter-annotator agreement? Is there an association between the inter-annotator agreement and the efficiency level of the learner (e.g. does the inter-annotator agreement among teachers decrease in essays by more advanced pupils)? Is the inter-annotator agreement different in teachers vs. laymen annotators of learner corpora? Does the data allow us to compile a set of error classes where the inter-annotator agreement among teachers would be significantly higher and use such a set of classes, for example, to train an automatic error classifier? 2) Is it possible to scale the influence of the proficiency in a Slavic language as L2 on the occurrence of various kinds of errors and their combinations? For example, from a practical point of view, would it be worthwhile to adapt the teaching to ethnic non-Slavic learners from former Soviet Union countries, or does their school Russian help them as well as native Slavic speakers? |