Thesis (Selection of subject)Thesis (Selection of subject)(version: 385)
Thesis details
   Login via CAS
Detection of contradictions in pairs of texts in Kazakh
Thesis title in Czech: Detekce kontradikce mezi dvěma texty v kazaštině
Thesis title in English: Detection of contradictions in pairs of texts in Kazakh
Key words: kontradikce zpracování přirozeného jazyka kazaština
English key words: contradiction natural language processing Kazakh
Academic year of topic announcement: 2018/2019
Thesis type: Bachelor's thesis
Thesis language: angličtina
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: Mgr. Rudolf Rosa, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 20.09.2018
Date of assignment: 20.09.2018
Confirmed by Study dept. on: 21.09.2018
Date and time of defence: 05.09.2019 09:00
Date of electronic submission:19.07.2019
Date of submission of printed version:19.07.2019
Date of proceeded defence: 05.09.2019
Opponents: Mgr. et Mgr. Ondřej Dušek, Ph.D.
 
 
 
Guidelines
Cílem bakalářské práce je implementovat nástroj, který umožní hledat kontradikce mezi dvěma texty v kazaštině.

Vstupem aplikace budou dva texty v kazaštině.
Úkolem aplikace bude:
- nalézt v textech věty, které hovoří o tomtéž
- nalézt v těchto větách případné kontradikce
Výstupem aplikace bude seznam vět s nalezenými kontradikcemi.

Aplikace bude implementována v jazyce Python, a bude využívat vhodné existující NLP nástroje a data (například Universal Dependencies, UDPipe, word2vec).
References
Marneffe, Marie-Catherine, Anna N. Rafferty, and Christopher D. Manning. "Finding contradictions in text." Proceedings of ACL-08: HLT (2008): 1039-1047.

Padó, Sebastian, et al. "Deciding Entailment and Contradiction with Stochastic and Edit Distance-based Alignment." TAC. 2008.

Milan Straka and Jana Straková. Tokenizing, POS Tagging, Lemmatizing and Parsing UD 2.0 with UDPipe. In Proceedings of the CoNLL 2017 Shared Task: Multilingual Parsing from Raw Text to Universal Dependencies, Vancouver, Canada, August 2017.

Universal Dependencies, http://universaldependencies.org/

Mikolov, Tomas, et al. "Efficient estimation of word representations in vector space." arXiv preprint arXiv:1301.3781(2013).

GIAMPICCOLO, Danilo, et al. The third pascal recognizing textual entailment challenge. In: Proceedings of the ACL-PASCAL workshop on textual entailment and paraphrasing. Association for Computational Linguistics, 2007. p. 1-9.

NGUYEN, Kim Anh; WALDE, Sabine Schulte im; VU, Ngoc Thang. Integrating distributional lexical contrast into word embeddings for antonym-synonym distinction. arXiv preprint arXiv:1605.07766, 2016.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html