Thesis (Selection of subject)Thesis (Selection of subject)(version: 385)
Thesis details
   Login via CAS
Implementace softwarové klávesnice pro vstup textu do aplikace pro strojový překlad
Thesis title in Czech: Implementace softwarové klávesnice pro vstup textu do aplikace pro strojový překlad
Thesis title in English: Implementation of a software keyboard to input text into the machine translation application
Key words: vstupní metody|jazykový model|softwarová klávesnice
English key words: input methods|language models|software keyboard
Academic year of topic announcement: 2022/2023
Thesis type: Bachelor's thesis
Thesis language: čeština
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: Mgr. Bc. Pavel Straňák, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 02.01.2023
Date of assignment: 02.01.2023
Confirmed by Study dept. on: 05.01.2023
Date and time of defence: 29.06.2023 09:00
Date of electronic submission:11.05.2023
Date of submission of printed version:11.05.2023
Date of proceeded defence: 29.06.2023
Opponents: Mgr. Martin Popel, Ph.D.
 
 
 
Guidelines
Cílem práce je implementovat softwarovou klávesnici pro vstup textu v jazyce, pro který chybí podpora pro vstup na hw klávesnici. Primární užití je zamýšleno pro webovou aplikaci strojového překladu vyvíjenou na ÚFAL MFF UK a základ implementace musí obsahovat podporu pro vstup ukrajinštiny.

Podpora vstupu textu v ukrajinštině bude mít několik podob:
- standardní ukrajinské rozložení kláves
- "fonetické" rozložení, tedy připodobněné QWERTY (https://podorozhiua.com/ukrainian-keyboard/)
- zápis latinkou v anglické transliteraci
- zápis latinkou v české transliteraci

Práce také prozkoumá možnost automatické opravy chyb ve vstupním textu, tedy například nepřesností ve zjednodušeném fonetickém zápisu, a případně vhodnou metodu oprav implementuje. Práce také prozkoumá možnost nápovědy, tedy doplňování při psaní textu pomocí jazykového modelu. Implementace bude provedena jako součást aplikace Charles Translator (https://translator.cuni.cz)
References
Náplava, Jakub. Natural Language Correction With Focus on Czech. Praha, 2022. Dizertační práce. Univerzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistiky.
Shanqing Cai, Subhashini Venugopalan, Katrin Tomanek, Ajit Narayanan, Meredith Morris, and Michael Brenner. 2022. Context-Aware Abbreviation Expansion Using Large Language Models. In Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, pages 1261–1275, Seattle, United States. Association for Computational Linguistics.
Kshitij Shah and Gerard de Melo. 2020. Correcting the Autocorrect: Context-Aware Typographical Error Correction via Training Data Augmentation. In Proceedings of the Twelfth Language Resources and Evaluation Conference, pages 6930–6936, Marseille, France. European Language Resources Association.
S. M. Shieber and R. Nelken. Abbreviated text input using language modeling. Journal of Natural Language Engineering, 2007
Preliminary scope of work
Podpora vstupu ukrajinštiny do překladače v českém prostředí, kde typicky není k dispozici ukrajinská klávesnice.
Preliminary scope of work in English
Support for input of Ukrainian text in the MT system in Czech environment where a Ukrainian keyboard is typically not available.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html