PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Jazykové technologie v praxi - NPFL128
Anglický název: Language Technologies in Practice
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2021
Semestr: letní
E-Kredity: 4
Rozsah, examinace: letní s.:2/1, KZ [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: angličtina
Způsob výuky: prezenční
Způsob výuky: prezenční
Další informace: https://ufal.mff.cuni.cz/courses/npfl128
Garant: RNDr. Jiří Hana, Ph.D.
Neslučitelnost : NPFL096
Záměnnost : NPFL096
Je neslučitelnost pro: NPFL096
Je záměnnost pro: NPFL096
Anotace -
Poslední úprava: doc. Mgr. Barbora Vidová Hladká, Ph.D. (31.01.2019)
Kurz se zabývá přístupy k řešení standardní úkolů NLP od rozpoznávání entit až po generování textů. Hodnotí různé metody (strojové učení, pravidlové systémy, větší lexikony, ...) a jejich kombinace. Část látky je probírána formou diskuzí nad konkrétními články, které studentí prezentují. Každý student implementuje prototypový systém, který řeší vybraný úkol.
Podmínky zakončení předmětu -
Poslední úprava: RNDr. Jiří Hana, Ph.D. (10.06.2019)

vedení diskuze k vybraným článkům (max 2 články na studenta)

projekt

Literatura -
Poslední úprava: doc. Mgr. Barbora Vidová Hladká, Ph.D. (31.01.2019)
  • Koskenniemi, Kimmo, 1983, Two-level Morphology: A General Computational Model for Word-Form Recognition and Production, University of Helsinki, Department of General Linguistics.
  • Goldsmith, John. 2001. Unsupervised Acquisition of the Morphology of a Natural Language.
  • Yarowsky, David and Richard Wicentowski. 2001. Minimally supervised morphological analysis by multimodal alignment. Proceedings of ACL-2000, Hong Kong, pages 207-216
  • Schone, Patrick and Daniel Jurafsky. 2001. Knowledge-Free Induction of Inflectional Morphologies. Proceedings of the North American Chapter of the Association for Computational Linguistics.
  • Cucerzan. 2007. Large-Scale Named Entity Disambiguation Based on Wikipedia Data
  • Daiber, Joachim, Max Jakob, Chris Hokamp and Pablo N. Mendes 2013. Improving Efficiency and Accuracy in Multilingual Entity Extraction. Proceedings of the 9th International Conference on Semantic Systems (I-Semantics)
  • Surdeanu, Mihai, David McClosky, Mason R. Smith, Andrey Gusev, and Christopher D. Manning. 2011. Customizing an Information Extraction System to a New Domain. In Proceedings of the ACL 2011 Workshop on Relational Models of Semantics
  • Reiter, Ehud and Robert Dale 2000. Building Natural Language Generation Systems. Cambridge University Press.

Sylabus -
Poslední úprava: doc. Mgr. Barbora Vidová Hladká, Ph.D. (31.01.2019)
  • zpracování morfologie
    • "inženýrský" přístup, lematizace
    • unsupervised a lightly-supervised metody
    • Linguistica, Yarowski & Wicentowski 2001, Schoene & Jurafsky 2001, Morfessor
  • analýza sentimentu
  • entity
    • pojmenované, nepojmenované a strukturované entity
    • detekce, normalizace, standardizace
    • disambiguace a propojení s databázemi
  • detekce intentu
  • extrakce vztahů
  • generování textu (NLG)
    • generování dokumentů generation of documents vs. short texts/phrases
    • klasické vs neuronové NLG
    • plánování dokumentu, mikroplánování, lexikalizace, realizace
 
Univerzita Karlova | Informační systém UK