Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 385)
Detail práce
   Přihlásit přes CAS
Morphological Segmentation in Czech using Word-Formation Network
Název práce v češtině: Morfologická segmentace v češtině s využitím slovotvorné sítě
Název v anglickém jazyce: Morphological Segmentation in Czech using Word-Formation Network
Klíčová slova: morfém, morfologie, segmentace
Klíčová slova anglicky: morpheme, morphology, segmentation
Akademický rok vypsání: 2019/2020
Typ práce: diplomová práce
Jazyk práce: angličtina
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: prof. Ing. Zdeněk Žabokrtský, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 19.05.2020
Datum zadání: 19.05.2020
Datum potvrzení stud. oddělením: 21.07.2020
Datum a čas obhajoby: 14.09.2020 09:00
Datum odevzdání elektronické podoby:30.07.2020
Datum odevzdání tištěné podoby:30.07.2020
Datum proběhlé obhajoby: 14.09.2020
Oponenti: RNDr. Jiří Hana, Ph.D.
 
 
 
Zásady pro vypracování
Tématem práce je automatická morfologická segmentace českých slov. Cílem je vytvořit algoritmus, který bude dělit základní tvary slov (lemmata) na morfémy - nejmenší jazykové jednotky nesoucí význam [1]. Student navrhne a implementuje postup, který umožní zkombinovat využití slovotvorné informace obsažené v databázi DeriNet [2] a v dalších ručně označkovaných datech s moderními metodami strojového učení [3], vyhodnotí celkovou úspěšnost a srovná ji s výsledky již publikovanými pro češtinu [4].
Seznam odborné literatury
[1] Miroslav Dokulil: Tvoření slov v češtině 1: Teorie odvozování slov, Nakladatelství Československé Akademie Věd, Praha, 1962.
[2] Jonáš Vidra, Zdeněk Žabokrtský, Magda Ševčíková, Lukáš Kyjánek: DeriNet 2.0: Towards an All-in-One Word-Formation Resource. In: Proceedings of the Second International Workshop on Resources and Tools for Derivational Morphology (DeriMo 2019), pp. 81-89, ÚFAL MFF UK, Praha, 2019.
[3] Ian Goodfellow and Yoshua Bengio and Aaron Courville: Deep Learning, MIT Press, 2016.
[4] Jonáš Vidra: Morphological segmentation of Czech Words. Diplomová práce, MFF UK, 2018.
 
Univerzita Karlova | Informační systém UK