Relation extraction in police records
Název práce v češtině: | Extrakce relací v policejních záznamech |
---|---|
Název v anglickém jazyce: | Relation extraction in police records |
Klíčová slova: | extrakce relací, strojové učení, zpracování přirozeného jazyka, Policie České Republiky, tree kernel |
Klíčová slova anglicky: | relation extraction, machine learning, natural language processing, Police of the Czech Republic, tree kernel |
Akademický rok vypsání: | 2014/2015 |
Typ práce: | diplomová práce |
Jazyk práce: | angličtina |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | prof. Ing. Zdeněk Žabokrtský, Ph.D. |
Řešitel: | skrytý![]() |
Datum přihlášení: | 19.05.2015 |
Datum zadání: | 19.05.2015 |
Datum potvrzení stud. oddělením: | 21.05.2015 |
Datum a čas obhajoby: | 12.09.2017 09:00 |
Datum odevzdání elektronické podoby: | 19.07.2017 |
Datum odevzdání tištěné podoby: | 21.07.2017 |
Datum proběhlé obhajoby: | 12.09.2017 |
Oponenti: | RNDr. David Mareček, Ph.D. |
Zásady pro vypracování |
Diplomová práce bude zaměřena na návrh a implementaci softwarového nástroje pro extrakci relací mezi entitami v textech z domény policejních záznamů. Cílem je usnadnit práci analytiků Policie ČR.
Vstupem nástroje bude text v češtině. Pro rozpoznání výskytů pojmenovaných entit v textu bude použit existující rozpoznávač NameTag. Výstupem nástroje budou binární relace mezi entitami rozpoznané v textu. Podobně jako v anotaci existující v policejních datech nebude určován podrobnější typ relace, ale pouze uspořádané dvojice entit, které se relací účastní. Přístup k autentickým datům bude poskytnut Policií ČR v rámci stávající spolupráce s Ústavem formální a aplikované lingvistiky. Data budou použita pro natrénování modelů a vyhodnocení úspěšnosti nástroje. Z bezpečnostních důvodů nebudou data použitá v experimentech součástí odevzdané diplomové práce. |
Seznam odborné literatury |
Yee Seng Chan and Dan Roth: Exploiting Background Knowledge for Relation Extraction. Proceedings of the 23rd International Conference on Computational Linguistics (Coling 2010), pages 152–160, Beijing, 2010
Hongzhi Xu, Changjian Hu, and Guoyang Shen: Discovery of Dependency Tree Patterns for Relation Extraction. 23rd Pacific Asia Conference on Language, Information and Computation, pages 851–858. 2009 Makoto Miwa, Rune Sætre, Yusuke Miyao, Jun’ichi Tsujii: Entity-Focused Sentence Simplification for Relation Extraction. Proceedings of the 23rd International Conference on Computational Linguistics (Coling 2010), pages 788–796, Beijing, 2010 |