Thesis (Selection of subject)Thesis (Selection of subject)(version: 385)
Thesis details
   Login via CAS
Automatic Alignment of Tectogrammatical Trees from Czech-English Parallel Corpus
Thesis title in Czech: Automatické párování tektogramatických stromů z
česko-anglického paralelního korpusu
Thesis title in English: Automatic Alignment of Tectogrammatical Trees from Czech-English Parallel Corpus
Academic year of topic announcement: 2007/2008
Thesis type: diploma thesis
Thesis language: angličtina
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: prof. Ing. Zdeněk Žabokrtský, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 18.10.2007
Date of assignment: 18.10.2007
Date and time of defence: 08.09.2008 00:00
Date of electronic submission:08.09.2008
Date of proceeded defence: 08.09.2008
Opponents: doc. RNDr. Ondřej Bojar, Ph.D.
 
 
 
Guidelines
Student se seznámí s anotačním schématem Pražského závislostního korpusu, zejména
s jeho tektogramatickou rovinou. Navrhne a implementuje automatický systém, který
pro sobě odpovídající vstupní český a anglický tektogramatický strom navrhne seznam
korespondencí mezi tektogramatickými uzly.
References
Dokumentace k PDT 2.0, viz http://ufal.mff.cuni.cz/pdt/

Mary Hearne, John Tinsley, Ventislav Zhenchev, Andy Way: Capturing Translational Divergences
with a Statistical Tree-to-tree Aligner. In: Proceedings of the 11th International
Conference on Theoretical and Methodological Issues in Machine Translation, Sweden, 2007

Arul Menezes, Stephen D. Richardson: A best-first alignment algorithm for automatic
extraction of transfer mappings from bilingual corpora. Proceedings of the Workshop
on Data-driven Machine Translation, 39, 2001.

Bojar, O; Žabokrtský, Z.: CzEng: Czech-English Parallel Corpus, Release version 0.5.
PBML 86 (Prague Bulletin of Mathematical Linguistics), 2006.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html