Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 385)
Detail práce
   Přihlásit přes CAS
Relation extraction in police records
Název práce v češtině: Extrakce relací v policejních záznamech
Název v anglickém jazyce: Relation extraction in police records
Klíčová slova: extrakce relací, strojové učení, zpracování přirozeného jazyka, Policie České Republiky, tree kernel
Klíčová slova anglicky: relation extraction, machine learning, natural language processing, Police of the Czech Republic, tree kernel
Akademický rok vypsání: 2014/2015
Typ práce: diplomová práce
Jazyk práce: angličtina
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: prof. Ing. Zdeněk Žabokrtský, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 19.05.2015
Datum zadání: 19.05.2015
Datum potvrzení stud. oddělením: 21.05.2015
Datum a čas obhajoby: 12.09.2017 09:00
Datum odevzdání elektronické podoby:19.07.2017
Datum odevzdání tištěné podoby:21.07.2017
Datum proběhlé obhajoby: 12.09.2017
Oponenti: RNDr. David Mareček, Ph.D.
 
 
 
Zásady pro vypracování
Diplomová práce bude zaměřena na návrh a implementaci softwarového nástroje pro extrakci relací mezi entitami v textech z domény policejních záznamů. Cílem je usnadnit práci analytiků Policie ČR.

Vstupem nástroje bude text v češtině. Pro rozpoznání výskytů pojmenovaných entit v textu bude použit existující rozpoznávač NameTag. Výstupem nástroje budou binární relace mezi entitami rozpoznané v textu. Podobně jako v anotaci existující v policejních datech nebude určován podrobnější typ relace, ale pouze uspořádané dvojice entit, které se relací účastní.

Přístup k autentickým datům bude poskytnut Policií ČR v rámci stávající spolupráce s Ústavem formální a aplikované lingvistiky. Data budou použita pro natrénování modelů a vyhodnocení úspěšnosti nástroje. Z bezpečnostních důvodů nebudou data použitá v experimentech součástí odevzdané diplomové práce.
Seznam odborné literatury
Yee Seng Chan and Dan Roth: Exploiting Background Knowledge for Relation Extraction. Proceedings of the 23rd International Conference on Computational Linguistics (Coling 2010), pages 152–160, Beijing, 2010

Hongzhi Xu, Changjian Hu, and Guoyang Shen: Discovery of Dependency Tree Patterns for Relation Extraction. 23rd Pacific Asia Conference on Language, Information and Computation, pages 851–858. 2009

Makoto Miwa, Rune Sætre, Yusuke Miyao, Jun’ichi Tsujii: Entity-Focused Sentence Simplification for Relation Extraction. Proceedings of the 23rd International Conference on Computational Linguistics (Coling 2010), pages 788–796, Beijing, 2010
 
Univerzita Karlova | Informační systém UK