Relation extraction in police records
Thesis title in Czech: | Extrakce relací v policejních záznamech |
---|---|
Thesis title in English: | Relation extraction in police records |
Key words: | extrakce relací, strojové učení, zpracování přirozeného jazyka, Policie České Republiky, tree kernel |
English key words: | relation extraction, machine learning, natural language processing, Police of the Czech Republic, tree kernel |
Academic year of topic announcement: | 2014/2015 |
Thesis type: | diploma thesis |
Thesis language: | angličtina |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | prof. Ing. Zdeněk Žabokrtský, Ph.D. |
Author: | hidden![]() |
Date of registration: | 19.05.2015 |
Date of assignment: | 19.05.2015 |
Confirmed by Study dept. on: | 21.05.2015 |
Date and time of defence: | 12.09.2017 09:00 |
Date of electronic submission: | 19.07.2017 |
Date of submission of printed version: | 21.07.2017 |
Date of proceeded defence: | 12.09.2017 |
Opponents: | RNDr. David Mareček, Ph.D. |
Guidelines |
Diplomová práce bude zaměřena na návrh a implementaci softwarového nástroje pro extrakci relací mezi entitami v textech z domény policejních záznamů. Cílem je usnadnit práci analytiků Policie ČR.
Vstupem nástroje bude text v češtině. Pro rozpoznání výskytů pojmenovaných entit v textu bude použit existující rozpoznávač NameTag. Výstupem nástroje budou binární relace mezi entitami rozpoznané v textu. Podobně jako v anotaci existující v policejních datech nebude určován podrobnější typ relace, ale pouze uspořádané dvojice entit, které se relací účastní. Přístup k autentickým datům bude poskytnut Policií ČR v rámci stávající spolupráce s Ústavem formální a aplikované lingvistiky. Data budou použita pro natrénování modelů a vyhodnocení úspěšnosti nástroje. Z bezpečnostních důvodů nebudou data použitá v experimentech součástí odevzdané diplomové práce. |
References |
Yee Seng Chan and Dan Roth: Exploiting Background Knowledge for Relation Extraction. Proceedings of the 23rd International Conference on Computational Linguistics (Coling 2010), pages 152–160, Beijing, 2010
Hongzhi Xu, Changjian Hu, and Guoyang Shen: Discovery of Dependency Tree Patterns for Relation Extraction. 23rd Pacific Asia Conference on Language, Information and Computation, pages 851–858. 2009 Makoto Miwa, Rune Sætre, Yusuke Miyao, Jun’ichi Tsujii: Entity-Focused Sentence Simplification for Relation Extraction. Proceedings of the 23rd International Conference on Computational Linguistics (Coling 2010), pages 788–796, Beijing, 2010 |