Automatic detection and attribution of quotes
Název práce v češtině: | Automatická identifikace citátů |
---|---|
Název v anglickém jazyce: | Automatic detection and attribution of quotes |
Klíčová slova: | NLP |
Klíčová slova anglicky: | NLP|quotation extraction|quotation attribution|CRFs|article|annotation |
Akademický rok vypsání: | 2021/2022 |
Typ práce: | diplomová práce |
Jazyk práce: | angličtina |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | RNDr. Jiří Hana, Ph.D. |
Řešitel: | skrytý![]() |
Datum přihlášení: | 27.01.2022 |
Datum zadání: | 27.01.2022 |
Datum potvrzení stud. oddělením: | 15.03.2022 |
Datum a čas obhajoby: | 06.06.2023 10:00 |
Datum odevzdání elektronické podoby: | 04.05.2023 |
Datum odevzdání tištěné podoby: | 15.05.2023 |
Datum proběhlé obhajoby: | 06.06.2023 |
Oponenti: | doc. Mgr. Barbora Vidová Hladká, Ph.D. |
Zásady pro vypracování |
Design a system automatically detecting direct and indirect quotes from news articles, including the person or organization the quote can be attributed to. The system should be easy to modify for a new language with minimal language-specific data required.
As part of the thesis, it should be evaluated how surface features (punctuation, capitalization, etc.), syntax, and named entities can be used to derive quotes and their attribution. For syntax, a framework conforming to the universal dependencies schema should be considered. |
Seznam odborné literatury |
Newell, Chris; Tim Cowlishaw, and David Man (2018). Quote extraction and analysis for news. DSJM, August 2018, London, UK
https://research.signal-ai.com/assets/RnD_at_the_BBC__and_quotes.pdf Pareti, Silvia 2016. PARC 3.0: A corpus of attribution relations. – Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC’16). European Language Resources Association (ELRA), 3914–3920. Särg, Dage, Karmen Kink, Karl-Oskar Masing (2021): Quote extraction from Estonian media: Analysis and tools. In Estonian Papers in Applied Linguistics. doi:10.5128/ERYa17.14 |