Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Typické vzory užívání anglických sloves
Název práce v češtině: Typické vzory užívání anglických sloves
Název v anglickém jazyce: Typical Usage Patterns of English Verbs
Akademický rok vypsání: 2009/2010
Typ práce: diplomová práce
Jazyk práce: čeština
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: RNDr. Martin Holub, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 16.11.2009
Datum zadání: 16.11.2009
Datum a čas obhajoby: 06.09.2010 00:00
Datum odevzdání elektronické podoby:06.09.2010
Datum proběhlé obhajoby: 06.09.2010
Oponenti: doc. RNDr. Markéta Lopatková, Ph.D.
 
 
 
Zásady pro vypracování
Metoda CPA (z angl. Corpus Pattern Analysis) je důsledně korpusová, empirická metoda, která analyzuje typické vzory užívání slov v jazykovém korpusu a popisuje význam sloves pomocí kontextových preferencí definovaných jak syntakticky, tak sémanticky [3]. V současné době pomocí CPA a s využitím Britského národního korpusu (BNC) vzniká Slovník vzorů užívání anglických sloves (PDEV, z angl. Pattern Dictionary of English Verbs) [1, 3]. V rámci tohoto projektu bylo již zkompilováno téměř 600 anglických sloves, která pokrývají cca 10% slovesných výskytů v BNC. Vedle slovníkových hesel obsahujících definici typických vzorů užívání sloves jsou též veřejně dostupná rozsáhlá korpusová data se slovesy označkovanými podle PDEV [3]. Nedílnou součástí CPA je empiricky vybudovaný systém sémantických typů [2, 3]. Kombinací sémantických typů a syntaxe metoda CPA originálním způsobem konkuruje tradičním přístupům k automatickému rozpoznávání významu sloves [4].

Cílem diplomové práce je analyzovat a co nejlépe využít dostupná data o typických vzorech užívání anglických sloves. Diplomová práce má zkoumat, jak lze využít PDEV pro automatickou analýzu lexikálního významu a má vést k návrhu procedur, které automatického rozpoznávání podpoří nebo pomohou zefektivnit další vývoj slovníku PDEV (včetně rozšiřování množiny anotovaných dat). Práce též musí obsahovat experimentální ověření účinnosti navržených procedur (tj. jejich empirickou evaluaci). Mimo jiné se předpokládá podrobná analýza dostupných dat včetně statistického vyhodnocení míry mezianotátorské shody při anotování typických vzorů užití a extrakce lexikálních jednotek realizujících jednotlivé sémantické typy v BNC s využitím automatického parsingu angličtiny.



Seznam odborné literatury
[1] Hanks, Patrick, and James Pustejovsky: A Pattern Dictionary for Natural Language Processing. In Revue Francaise de linguistique appliquée, 10:2, 2005.

[2] Hanks Patrick, Karel Pala and Pavel Rychly: Towards an empirically well-founded ontology for NLP. In Proceedings of the 4th International Workshop on Generative Approaches to the Lexicon, Paris, 2007.

[3] Webové stránky mezinárodního projektu CPA. http://nlp.fi.muni.cz/projekty/cpa/.

[4] Agirre, E. and Edmonds, P. (eds.): Word Sense Disambiguation: Algorithms and Applications. Springer, 2007. (vybrané kapitoly)

[5] Daniel Jurafsky and James H. Martin: SPEECH and LANGUAGE PROCESSING. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Prentice Hall, 2009. (vybrané kapitoly)
 
Univerzita Karlova | Informační systém UK