PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Aplikace NLP - NPFX093
Anglický název: NLP Applications
Zajišťuje: Studijní oddělení (32-STUD)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2022
Semestr: letní
E-Kredity: 5
Rozsah, examinace: letní s.:2/1, KZ [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Je zajišťováno předmětem: NPFL093
Garant: doc. RNDr. Vladislav Kuboň, Ph.D.
Třída: Informatika Mgr. - Matematická lingvistika
Kategorizace předmětu: Informatika > Počítačová a formální lingvistika
Prerekvizity : {NXXX011, NXXX012, NXXX013, NXXX070, NXXX071}
Neslučitelnost : NPFL093
Záměnnost : NPFL093
Anotace -
Poslední úprava: T_UFAL (10.05.2010)
Cílem předmětu je seznámit studenty se základními typy aplikací počítačové lingvistiky a dát jim příležitost si některé z nich vyzkoušet na cvičeních. Jedná se zejména o systémy automatického překladu a automatizované nástroje na podporu lidského překladu, o lokalizační nástroje, o vyhledávání a extrakci informací, zodpovídání dotazů, rozpoznávání mluvené řeči, kontrolu překlepů, kontrolu gramatické správnosti, generování textů v přirozeném jazyce apod.
Podmínky zakončení předmětu - angličtina
Poslední úprava: doc. RNDr. Vladislav Kuboň, Ph.D. (22.04.2020)

The course requires a continuous work of students in the form of reports describing topics of individual lectures. The reports are required even if a student is not present on the lecture, in such a case (s)he submits a general report on the topic of the missed lecture. A participation is strongly recommended. After submitting all reports, the student obtains a grade based upon the quality of those reports.

Literatura -
Poslední úprava: T_UFAL (10.05.2010)

Handbook of NLP, ed. N.Indurkhya, F.Damerau, CRC Press, 2010.

Foundations of Statistical Natural Language Processing, C. Manning and H. Schütze, MIT Press, 1999.

Sylabus -
Poslední úprava: T_UFAL (10.05.2010)

1. Úvod - přehled základních komponent aplikací.

2. Kontrola překlepů

Slovníkové metody vs. kontrola neexistujících skupin znaků, metriky pro zjišťování podobnosti řetězců, komunikace s uživatelem.

3. Kontrola gramatické správnosti

Chybové vzorky vs. syntaktická analýza, typy zachytitelných chyb, postoj k uživateli, RFODG a LanGR.

4. Nástroje na podporu lidského překladu

Překladová paměť a varianty jejího použití v komerčních produktech, řízené psaní, hierarchie glosářů.

5. Automatický překlad

Google Translate vs. pravidlové komerční systémy (Systran, PC Translator), metody měření kvality překladu, vyhodnocování překladových soutěží, projekt Euromatrix.

6. Lokalizace

Rozdíly mezi překladem a lokalizací, komerční lokalizační nástroje.

7. Generování

Generování textů z tektogramatické roviny.

8. Vyhledávání a extrakce informací

Základní modely, evaluační metriky, metriky podobnosti textů, lemmatizace, stop slova, role jazykových nástrojů, projekt Malach.

9. Zodpovídání dotazů

Dialogové systémy, multimodální komunikace.

10. Rozpoznávání a syntéza mluvené řeči

Základní problémy, používané algoritmy.

11. Sémantický web

Využití lingvistických metod pro získávání informací z webu, role tektogramatické roviny.

 
Univerzita Karlova | Informační systém UK