Implementace softwarové klávesnice pro vstup textu do aplikace pro strojový překlad
Název práce v češtině: | Implementace softwarové klávesnice pro vstup textu do aplikace pro strojový překlad |
---|---|
Název v anglickém jazyce: | Implementation of a software keyboard to input text into the machine translation application |
Klíčová slova: | vstupní metody|jazykový model|softwarová klávesnice |
Klíčová slova anglicky: | input methods|language models|software keyboard |
Akademický rok vypsání: | 2022/2023 |
Typ práce: | bakalářská práce |
Jazyk práce: | čeština |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | Mgr. Bc. Pavel Straňák, Ph.D. |
Řešitel: | skrytý![]() |
Datum přihlášení: | 02.01.2023 |
Datum zadání: | 02.01.2023 |
Datum potvrzení stud. oddělením: | 05.01.2023 |
Datum a čas obhajoby: | 29.06.2023 09:00 |
Datum odevzdání elektronické podoby: | 11.05.2023 |
Datum odevzdání tištěné podoby: | 11.05.2023 |
Datum proběhlé obhajoby: | 29.06.2023 |
Oponenti: | Mgr. Martin Popel, Ph.D. |
Zásady pro vypracování |
Cílem práce je implementovat softwarovou klávesnici pro vstup textu v jazyce, pro který chybí podpora pro vstup na hw klávesnici. Primární užití je zamýšleno pro webovou aplikaci strojového překladu vyvíjenou na ÚFAL MFF UK a základ implementace musí obsahovat podporu pro vstup ukrajinštiny.
Podpora vstupu textu v ukrajinštině bude mít několik podob: - standardní ukrajinské rozložení kláves - "fonetické" rozložení, tedy připodobněné QWERTY (https://podorozhiua.com/ukrainian-keyboard/) - zápis latinkou v anglické transliteraci - zápis latinkou v české transliteraci Práce také prozkoumá možnost automatické opravy chyb ve vstupním textu, tedy například nepřesností ve zjednodušeném fonetickém zápisu, a případně vhodnou metodu oprav implementuje. Práce také prozkoumá možnost nápovědy, tedy doplňování při psaní textu pomocí jazykového modelu. Implementace bude provedena jako součást aplikace Charles Translator (https://translator.cuni.cz) |
Seznam odborné literatury |
Náplava, Jakub. Natural Language Correction With Focus on Czech. Praha, 2022. Dizertační práce. Univerzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistiky.
Shanqing Cai, Subhashini Venugopalan, Katrin Tomanek, Ajit Narayanan, Meredith Morris, and Michael Brenner. 2022. Context-Aware Abbreviation Expansion Using Large Language Models. In Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, pages 1261–1275, Seattle, United States. Association for Computational Linguistics. Kshitij Shah and Gerard de Melo. 2020. Correcting the Autocorrect: Context-Aware Typographical Error Correction via Training Data Augmentation. In Proceedings of the Twelfth Language Resources and Evaluation Conference, pages 6930–6936, Marseille, France. European Language Resources Association. S. M. Shieber and R. Nelken. Abbreviated text input using language modeling. Journal of Natural Language Engineering, 2007 |
Předběžná náplň práce |
Podpora vstupu ukrajinštiny do překladače v českém prostředí, kde typicky není k dispozici ukrajinská klávesnice. |
Předběžná náplň práce v anglickém jazyce |
Support for input of Ukrainian text in the MT system in Czech environment where a Ukrainian keyboard is typically not available. |