Detection of contradictions in pairs of texts in Kazakh
Thesis title in Czech: | Detekce kontradikce mezi dvěma texty v kazaštině |
---|---|
Thesis title in English: | Detection of contradictions in pairs of texts in Kazakh |
Key words: | kontradikce zpracování přirozeného jazyka kazaština |
English key words: | contradiction natural language processing Kazakh |
Academic year of topic announcement: | 2018/2019 |
Thesis type: | Bachelor's thesis |
Thesis language: | angličtina |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | Mgr. Rudolf Rosa, Ph.D. |
Author: | hidden![]() |
Date of registration: | 20.09.2018 |
Date of assignment: | 20.09.2018 |
Confirmed by Study dept. on: | 21.09.2018 |
Date and time of defence: | 05.09.2019 09:00 |
Date of electronic submission: | 19.07.2019 |
Date of submission of printed version: | 19.07.2019 |
Date of proceeded defence: | 05.09.2019 |
Opponents: | Mgr. et Mgr. Ondřej Dušek, Ph.D. |
Guidelines |
Cílem bakalářské práce je implementovat nástroj, který umožní hledat kontradikce mezi dvěma texty v kazaštině.
Vstupem aplikace budou dva texty v kazaštině. Úkolem aplikace bude: - nalézt v textech věty, které hovoří o tomtéž - nalézt v těchto větách případné kontradikce Výstupem aplikace bude seznam vět s nalezenými kontradikcemi. Aplikace bude implementována v jazyce Python, a bude využívat vhodné existující NLP nástroje a data (například Universal Dependencies, UDPipe, word2vec). |
References |
Marneffe, Marie-Catherine, Anna N. Rafferty, and Christopher D. Manning. "Finding contradictions in text." Proceedings of ACL-08: HLT (2008): 1039-1047.
Padó, Sebastian, et al. "Deciding Entailment and Contradiction with Stochastic and Edit Distance-based Alignment." TAC. 2008. Milan Straka and Jana Straková. Tokenizing, POS Tagging, Lemmatizing and Parsing UD 2.0 with UDPipe. In Proceedings of the CoNLL 2017 Shared Task: Multilingual Parsing from Raw Text to Universal Dependencies, Vancouver, Canada, August 2017. Universal Dependencies, http://universaldependencies.org/ Mikolov, Tomas, et al. "Efficient estimation of word representations in vector space." arXiv preprint arXiv:1301.3781(2013). GIAMPICCOLO, Danilo, et al. The third pascal recognizing textual entailment challenge. In: Proceedings of the ACL-PASCAL workshop on textual entailment and paraphrasing. Association for Computational Linguistics, 2007. p. 1-9. NGUYEN, Kim Anh; WALDE, Sabine Schulte im; VU, Ngoc Thang. Integrating distributional lexical contrast into word embeddings for antonym-synonym distinction. arXiv preprint arXiv:1605.07766, 2016. |