Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 385)
Detail práce
   Přihlásit přes CAS
Implementace softwarové klávesnice pro vstup textu do aplikace pro strojový překlad
Název práce v češtině: Implementace softwarové klávesnice pro vstup textu do aplikace pro strojový překlad
Název v anglickém jazyce: Implementation of a software keyboard to input text into the machine translation application
Klíčová slova: vstupní metody|jazykový model|softwarová klávesnice
Klíčová slova anglicky: input methods|language models|software keyboard
Akademický rok vypsání: 2022/2023
Typ práce: bakalářská práce
Jazyk práce: čeština
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: Mgr. Bc. Pavel Straňák, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 02.01.2023
Datum zadání: 02.01.2023
Datum potvrzení stud. oddělením: 05.01.2023
Datum a čas obhajoby: 29.06.2023 09:00
Datum odevzdání elektronické podoby:11.05.2023
Datum odevzdání tištěné podoby:11.05.2023
Datum proběhlé obhajoby: 29.06.2023
Oponenti: Mgr. Martin Popel, Ph.D.
 
 
 
Zásady pro vypracování
Cílem práce je implementovat softwarovou klávesnici pro vstup textu v jazyce, pro který chybí podpora pro vstup na hw klávesnici. Primární užití je zamýšleno pro webovou aplikaci strojového překladu vyvíjenou na ÚFAL MFF UK a základ implementace musí obsahovat podporu pro vstup ukrajinštiny.

Podpora vstupu textu v ukrajinštině bude mít několik podob:
- standardní ukrajinské rozložení kláves
- "fonetické" rozložení, tedy připodobněné QWERTY (https://podorozhiua.com/ukrainian-keyboard/)
- zápis latinkou v anglické transliteraci
- zápis latinkou v české transliteraci

Práce také prozkoumá možnost automatické opravy chyb ve vstupním textu, tedy například nepřesností ve zjednodušeném fonetickém zápisu, a případně vhodnou metodu oprav implementuje. Práce také prozkoumá možnost nápovědy, tedy doplňování při psaní textu pomocí jazykového modelu. Implementace bude provedena jako součást aplikace Charles Translator (https://translator.cuni.cz)
Seznam odborné literatury
Náplava, Jakub. Natural Language Correction With Focus on Czech. Praha, 2022. Dizertační práce. Univerzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistiky.
Shanqing Cai, Subhashini Venugopalan, Katrin Tomanek, Ajit Narayanan, Meredith Morris, and Michael Brenner. 2022. Context-Aware Abbreviation Expansion Using Large Language Models. In Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, pages 1261–1275, Seattle, United States. Association for Computational Linguistics.
Kshitij Shah and Gerard de Melo. 2020. Correcting the Autocorrect: Context-Aware Typographical Error Correction via Training Data Augmentation. In Proceedings of the Twelfth Language Resources and Evaluation Conference, pages 6930–6936, Marseille, France. European Language Resources Association.
S. M. Shieber and R. Nelken. Abbreviated text input using language modeling. Journal of Natural Language Engineering, 2007
Předběžná náplň práce
Podpora vstupu ukrajinštiny do překladače v českém prostředí, kde typicky není k dispozici ukrajinská klávesnice.
Předběžná náplň práce v anglickém jazyce
Support for input of Ukrainian text in the MT system in Czech environment where a Ukrainian keyboard is typically not available.
 
Univerzita Karlova | Informační systém UK