Implementace softwarové klávesnice pro vstup textu do aplikace pro strojový překlad
Thesis title in Czech: | Implementace softwarové klávesnice pro vstup textu do aplikace pro strojový překlad |
---|---|
Thesis title in English: | Implementation of a software keyboard to input text into the machine translation application |
Key words: | vstupní metody|jazykový model|softwarová klávesnice |
English key words: | input methods|language models|software keyboard |
Academic year of topic announcement: | 2022/2023 |
Thesis type: | Bachelor's thesis |
Thesis language: | čeština |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | Mgr. Bc. Pavel Straňák, Ph.D. |
Author: | hidden![]() |
Date of registration: | 02.01.2023 |
Date of assignment: | 02.01.2023 |
Confirmed by Study dept. on: | 05.01.2023 |
Date and time of defence: | 29.06.2023 09:00 |
Date of electronic submission: | 11.05.2023 |
Date of submission of printed version: | 11.05.2023 |
Date of proceeded defence: | 29.06.2023 |
Opponents: | Mgr. Martin Popel, Ph.D. |
Guidelines |
Cílem práce je implementovat softwarovou klávesnici pro vstup textu v jazyce, pro který chybí podpora pro vstup na hw klávesnici. Primární užití je zamýšleno pro webovou aplikaci strojového překladu vyvíjenou na ÚFAL MFF UK a základ implementace musí obsahovat podporu pro vstup ukrajinštiny.
Podpora vstupu textu v ukrajinštině bude mít několik podob: - standardní ukrajinské rozložení kláves - "fonetické" rozložení, tedy připodobněné QWERTY (https://podorozhiua.com/ukrainian-keyboard/) - zápis latinkou v anglické transliteraci - zápis latinkou v české transliteraci Práce také prozkoumá možnost automatické opravy chyb ve vstupním textu, tedy například nepřesností ve zjednodušeném fonetickém zápisu, a případně vhodnou metodu oprav implementuje. Práce také prozkoumá možnost nápovědy, tedy doplňování při psaní textu pomocí jazykového modelu. Implementace bude provedena jako součást aplikace Charles Translator (https://translator.cuni.cz) |
References |
Náplava, Jakub. Natural Language Correction With Focus on Czech. Praha, 2022. Dizertační práce. Univerzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistiky.
Shanqing Cai, Subhashini Venugopalan, Katrin Tomanek, Ajit Narayanan, Meredith Morris, and Michael Brenner. 2022. Context-Aware Abbreviation Expansion Using Large Language Models. In Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, pages 1261–1275, Seattle, United States. Association for Computational Linguistics. Kshitij Shah and Gerard de Melo. 2020. Correcting the Autocorrect: Context-Aware Typographical Error Correction via Training Data Augmentation. In Proceedings of the Twelfth Language Resources and Evaluation Conference, pages 6930–6936, Marseille, France. European Language Resources Association. S. M. Shieber and R. Nelken. Abbreviated text input using language modeling. Journal of Natural Language Engineering, 2007 |
Preliminary scope of work |
Podpora vstupu ukrajinštiny do překladače v českém prostředí, kde typicky není k dispozici ukrajinská klávesnice. |
Preliminary scope of work in English |
Support for input of Ukrainian text in the MT system in Czech environment where a Ukrainian keyboard is typically not available. |