Seznámení s hlavními obory počítačové lingvistiky a s problémy, které tyto obory řeší. Důraz je kladen na zejména na strojový překlad, syntaktickou analýzu, morfologii a korpusovou lingvistiku.
Poslední úprava: T_UFAL (10.05.2001)
The main goal of this course is to provide an overview of individual subfields of computational linguistics. Main issues being solved by these subfields are also mentioned. Among the subfields the course stresses are machine translation, syntactic parsing, morphology and corpus linguistics.
Poslední úprava: T_UFAL (10.05.2001)
Podmínky zakončení předmětu -
Předmět je zakončen písemnou zkouškou, která obsahuje otázky z témat odpřednesených v průběhu semestru. Počet otázek je 8-10, jedna z nich vyžaduje rozsáhlejší odpověď a týká se popisu některého z přednesených algoritmů.
Poslední úprava: Kuboň Vladislav, doc. RNDr., Ph.D. (15.10.2017)
The course finishes with a written exam. It contains 8-10 questions which concern the topics covered in lectures. One of the questions requires a detailed description of one of the algorithms described in the course of the semester.
Poslední úprava: Kuboň Vladislav, doc. RNDr., Ph.D. (15.10.2017)
Literatura -
R. Grishman. Computational Linguistics: An Introduction. ACL Studies in Nantural Language Processing. Cambridge University Press, 1986.
P. Sgall. E. Hajičová and J. Panevová. Učíme stroje česky. Academia. P. Sgall a kolektiv. Úvod do syntaxe a sémantiky. Academia. 1986.
Daniel Juraffsky, James H. Martin: Speech and Language processing (draft of the 3rd edition available at https://web.stanford.edu/~jurafsky/slp3/) 2023
KIRSCHNER. Z. (1983). MOSAIC - A Method of Automatic Extraction of Significant Terms from Texts. Praha : MFF UK, 1983. 124 s.
Králíková, K., Panevová, J. (1990). "ASIMUT - A Method for Automatic Information Retrieval from Full Texts", Explizite Beschreibung der Sprache und automatische Textbearbeitung XVII, Faculty of Mathematics and Physics, Charles University, Prague.
Jan Hajič, Alena Böhmová, Eva Hajičová, Barbora Vidová Hladká: "The Prague Dependency Treebank: A Three-Level Annotation Scenario". In: A. Abeillé (ed.): Treebanks: Building and Using Parsed Corpora, Amsterdam:Kluwer, 2000, pp. 103-127
Poslední úprava: Kuboň Vladislav, doc. RNDr., Ph.D. (16.05.2023)
R. Grishman. Computational Linguistics: An Introduction. ACL Studies in Nantural Language Processing. Cambridge University Press, 1986.
KIRSCHNER. Z. (1983). MOSAIC - A Method of Automatic Extraction of Significant Terms from Texts. Praha : MFF UK, 1983. 124 s.
Králíková, K., Panevová, J. (1990). "ASIMUT - A Method for Automatic Information Retrieval from Full Texts", Explizite Beschreibung der Sprache und automatische Textbearbeitung XVII, Faculty of Mathematics and Physics, Charles University, Prague.
Jan Hajič, Alena Böhmová, Eva Hajičová, Barbora Vidová Hladká: "The Prague Dependency Treebank: A Three-Level Annotation Scenario". In: A. Abeillé (ed.): Treebanks: Building and Using Parsed Corpora, Amsterdam:Kluwer, 2000, pp. 103-127
Daniel Juraffsky, James H. Martin: Speech and Language processing (draft of the 3rd edition available at https://web.stanford.edu/~jurafsky/slp3/) 2023
Poslední úprava: Kuboň Vladislav, doc. RNDr., Ph.D. (15.05.2023)
Sylabus -
1. Úvod, přehled podoborů počítačové lingvistiky a jejich obsah
2. Přirozený jazyk, jeho funkce a struktura
3. Zpracování jazyka na úrovni znaků, morfologická analýza a značkování, metody korekce překlepů
4. Základní principy fungování skrytých Markovských modelů v morfologii přirozených jazyků
5. Využití vlastností češtiny v jednoduchých aplikacích (systémy ASIMUT a MOZAIKA)
6. Syntaxe jazyka a její formální zachycení v datových strukturách - složkové a závislostní stromy