Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 385)
Detail práce
   Přihlásit přes CAS
Automatic detection and attribution of quotes
Název práce v češtině: Automatická identifikace citátů
Název v anglickém jazyce: Automatic detection and attribution of quotes
Klíčová slova: NLP
Klíčová slova anglicky: NLP|quotation extraction|quotation attribution|CRFs|article|annotation
Akademický rok vypsání: 2021/2022
Typ práce: diplomová práce
Jazyk práce: angličtina
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: RNDr. Jiří Hana, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 27.01.2022
Datum zadání: 27.01.2022
Datum potvrzení stud. oddělením: 15.03.2022
Datum a čas obhajoby: 06.06.2023 10:00
Datum odevzdání elektronické podoby:04.05.2023
Datum odevzdání tištěné podoby:15.05.2023
Datum proběhlé obhajoby: 06.06.2023
Oponenti: doc. Mgr. Barbora Vidová Hladká, Ph.D.
 
 
 
Zásady pro vypracování
Design a system automatically detecting direct and indirect quotes from news articles, including the person or organization the quote can be attributed to. The system should be easy to modify for a new language with minimal language-specific data required.

As part of the thesis, it should be evaluated how surface features (punctuation, capitalization, etc.), syntax, and named entities can be used to derive quotes and their attribution. For syntax, a framework conforming to the universal dependencies schema should be considered.
Seznam odborné literatury
Newell, Chris; Tim Cowlishaw, and David Man (2018). Quote extraction and analysis for news. DSJM, August 2018, London, UK
https://research.signal-ai.com/assets/RnD_at_the_BBC__and_quotes.pdf

Pareti, Silvia 2016. PARC 3.0: A corpus of attribution relations. – Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC’16). European Language Resources Association (ELRA), 3914–3920.

Särg, Dage, Karmen Kink, Karl-Oskar Masing (2021): Quote extraction from Estonian media: Analysis and tools. In Estonian Papers in Applied Linguistics. doi:10.5128/ERYa17.14
 
Univerzita Karlova | Informační systém UK