Pravděpodobnostní překladový slovník
Thesis title in Czech: | Pravděpodobnostní překladový slovník |
---|---|
Thesis title in English: | Probabilistic Translation Dictionary |
Academic year of topic announcement: | 2007/2008 |
Thesis type: | diploma thesis |
Thesis language: | angličtina |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | prof. Ing. Zdeněk Žabokrtský, Ph.D. |
Author: | hidden![]() |
Date of registration: | 28.11.2007 |
Date of assignment: | 28.11.2007 |
Date and time of defence: | 14.09.2009 00:00 |
Date of electronic submission: | 14.09.2009 |
Date of proceeded defence: | 14.09.2009 |
Opponents: | doc. RNDr. Pavel Pecina, Ph.D. |
Guidelines |
Student se podrobně seznámí s datovými zdroji využitelnými pro
úlohu strojového překladu pro pár angličtina-čeština (mj. paralelní korpusy [1] a [2]). Navrhne a implementuje postup pro automatické rozšíření existujícího slovníku popsaného v [3], a to co do množství překladových hesel i bohatosti statistické informace. Zlepšení v pokrytí slovníku vyhodnotí na korpusových datech. V jazyku Perl implementuje pro vzniklý slovník aplikační rozhraní vhodné pro potřeby strojového překladu. |
References |
[1] Jan Cuřín, et al. Prague Czech-English Dependency Treebank 1.0.
Linguistic Data Consortium, Philadelphia, 2004. [2] Bojar, O; Žabokrtský, Z.: CzEng: Czech-English Parallel Corpus, Release version 0.5. PBML 86 (Prague Bulletin of Mathematical Linguistics), 2006. [3] Jan Cuřín: Statistical Methods in Czech-English Machine Translation. PhD Thesis. Charles University, Faculty of Mathematics and Physics, 2006. |