Morphological Segmentation in Czech using Word-Formation Network
Název práce v češtině: | Morfologická segmentace v češtině s využitím slovotvorné sítě |
---|---|
Název v anglickém jazyce: | Morphological Segmentation in Czech using Word-Formation Network |
Klíčová slova: | morfém, morfologie, segmentace |
Klíčová slova anglicky: | morpheme, morphology, segmentation |
Akademický rok vypsání: | 2019/2020 |
Typ práce: | diplomová práce |
Jazyk práce: | angličtina |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | prof. Ing. Zdeněk Žabokrtský, Ph.D. |
Řešitel: | skrytý![]() |
Datum přihlášení: | 19.05.2020 |
Datum zadání: | 19.05.2020 |
Datum potvrzení stud. oddělením: | 21.07.2020 |
Datum a čas obhajoby: | 14.09.2020 09:00 |
Datum odevzdání elektronické podoby: | 30.07.2020 |
Datum odevzdání tištěné podoby: | 30.07.2020 |
Datum proběhlé obhajoby: | 14.09.2020 |
Oponenti: | RNDr. Jiří Hana, Ph.D. |
Zásady pro vypracování |
Tématem práce je automatická morfologická segmentace českých slov. Cílem je vytvořit algoritmus, který bude dělit základní tvary slov (lemmata) na morfémy - nejmenší jazykové jednotky nesoucí význam [1]. Student navrhne a implementuje postup, který umožní zkombinovat využití slovotvorné informace obsažené v databázi DeriNet [2] a v dalších ručně označkovaných datech s moderními metodami strojového učení [3], vyhodnotí celkovou úspěšnost a srovná ji s výsledky již publikovanými pro češtinu [4]. |
Seznam odborné literatury |
[1] Miroslav Dokulil: Tvoření slov v češtině 1: Teorie odvozování slov, Nakladatelství Československé Akademie Věd, Praha, 1962.
[2] Jonáš Vidra, Zdeněk Žabokrtský, Magda Ševčíková, Lukáš Kyjánek: DeriNet 2.0: Towards an All-in-One Word-Formation Resource. In: Proceedings of the Second International Workshop on Resources and Tools for Derivational Morphology (DeriMo 2019), pp. 81-89, ÚFAL MFF UK, Praha, 2019. [3] Ian Goodfellow and Yoshua Bengio and Aaron Courville: Deep Learning, MIT Press, 2016. [4] Jonáš Vidra: Morphological segmentation of Czech Words. Diplomová práce, MFF UK, 2018. |