Thesis (Selection of subject)Thesis (Selection of subject)(version: 385)
Thesis details
   Login via CAS
Pravděpodobnostní překladový slovník
Thesis title in Czech: Pravděpodobnostní překladový slovník
Thesis title in English: Probabilistic Translation Dictionary
Academic year of topic announcement: 2007/2008
Thesis type: diploma thesis
Thesis language: angličtina
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: prof. Ing. Zdeněk Žabokrtský, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 28.11.2007
Date of assignment: 28.11.2007
Date and time of defence: 14.09.2009 00:00
Date of electronic submission:14.09.2009
Date of proceeded defence: 14.09.2009
Opponents: doc. RNDr. Pavel Pecina, Ph.D.
 
 
 
Guidelines
Student se podrobně seznámí s datovými zdroji využitelnými pro
úlohu strojového překladu pro pár angličtina-čeština
(mj. paralelní korpusy [1] a [2]). Navrhne a implementuje postup
pro automatické rozšíření existujícího slovníku popsaného v [3],
a to co do množství překladových hesel i bohatosti statistické informace.
Zlepšení v pokrytí slovníku vyhodnotí na korpusových datech.
V jazyku Perl implementuje pro vzniklý slovník aplikační rozhraní
vhodné pro potřeby strojového překladu.
References
[1] Jan Cuřín, et al. Prague Czech-English Dependency Treebank 1.0.
Linguistic Data Consortium, Philadelphia, 2004.

[2] Bojar, O; Žabokrtský, Z.: CzEng: Czech-English Parallel Corpus, Release version 0.5.
PBML 86 (Prague Bulletin of Mathematical Linguistics), 2006.

[3] Jan Cuřín: Statistical Methods in Czech-English Machine Translation.
PhD Thesis. Charles University, Faculty of Mathematics and Physics, 2006.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html