Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Sémantická anotace doménově závislých dat
Název práce v češtině: Sémantická anotace doménově závislých dat
Název v anglickém jazyce: Semantic annotation of domain dependent data
Klíčová slova: sémantický web, sémantická anotace, manuální anotace webových stránek, rozšíření prohlíţeče Google Chrome pro sémantickou anotaci
Klíčová slova anglicky: semantic web, semantic annotation, manual web pages annotation, Google Chrome extension for semantic annotation
Akademický rok vypsání: 2010/2011
Typ práce: diplomová práce
Jazyk práce: čeština
Ústav: Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel: prof. RNDr. Peter Vojtáš, DrSc.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 03.06.2010
Datum zadání: 30.09.2010
Datum a čas obhajoby: 05.09.2011 09:30
Datum odevzdání elektronické podoby:19.07.2011
Datum odevzdání tištěné podoby:05.08.2011
Datum proběhlé obhajoby: 05.09.2011
Oponenti: RNDr. Michal Kopecký, Ph.D.
 
 
 
Zásady pro vypracování
Cílem diplomové práce je navrhnout uživatelsky přívětivé rozhraní a možné přístupy ke zjednodušení anotace webových stránek z vybrané domény obyčejnými uživateli. Je snahou uživateli co nejvíce zjednodušit anotaci webových stránek a to na základě již dříve anotovaných webových stránek z dané domény nebo pomocí metod automatické anotace. Uživatel může nabízených strojových metod využít nebo nemusí. Výsledek anotace ale záleží především na rozhodnutí uživatele.
Řešitel nejprve vypracuje modelové příklady hledání reálných uživatelů v doménově závislých datech na webu, aby zjistil požadavky uživatelů. Poté zmapuje možné přístupy k anotaci strukturovaných i nestrukturovaných dat s využitím doménové znalosti. Lze již předpokládat existenci nějaké doménově nezávislé anotace. Na základě zjištěných poznatků řešitel navrhne přístupy pro zjednodušení anotace webových stránek. V rámci práce bude třeba navrhnout způsob získávání dat od uživatele, uživatelsky přívětivý způsob práce s ontologií i možnosti učení anotačního nástroje od uživatele. Primárním zdrojem doménové znalosti bude uživatel a jím anotované webové stránky, ze kterých se anotační nástroj zkusí doménovou znalost naučit a nabízet dalším uživatelům.
V praktické části práce zkusí řešitel navrhnout uživatelsky přívětivé rozhraní, které obyčejnému uživateli umožní jednoduše anotovat webové stránky z vybrané domény na ontologii. Anotační nástroj se bude snažit s využitím navržených metod uživateli co nejvíce zjednodušit anotaci webových stránek, a to na základě podobných anotovaných webových stránek posbíraných od dalších uživatelů.
Seznam odborné literatury
http://www.w3.org/2001/sw/wiki/Main_Page
http://semanticweb.org/wiki/Category:Semantic_annotation_tool
dalsi nastroje pro extrakci/anotaci:
Lixto Visual Developer (http://www.lixto.com)
Flersa (http://www.scms.es/joomla/ -> demo)
TopBraid Suite -> The Basic RDFa Editor (http://www.topquadrant.com/w3c/RDFa/)
Ontology Annotation Tool (OAT) - GATE plugin (http://gate.ac.uk/sale/tao/splitch14.html#sec:ontologies:ocat)
From Manual to Semi-automatic Semantic Annotation: About Ontology-based Text Annotation Tools (2000) M. Erdmann, A. Maedche,
H.-P. Schnurr, S. Staab (http://citeseer.ist.psu.edu/erdmann00from.html)
Vidome D. Maruscaka: Eckhardt, A., Horvath, T., Maruscak, D., Novotny, R., Vojtas, P.: Uncertainty Issues and Algorithms in Automating Process Connecting Web and User, Lecture Notes in Computer Science, vol. 5327. Springer Verlag (2008)
Extrakce JD: Dedek, J., Vojtas, P.: Linguistic extraction for semantic annotation. In: Badica, C., Mangioni, G., Carchiolo, V., Burdescu, D. (Eds.), IDC Vol. 162 of Studies in Computational Intelligence. Springer-Verlag, 85--94. URL http://www.springerlink.com/content/w7213j007t416132/

Předběžná náplň práce
Vyhledávání na webu pomocí klíčových slov je pro uživatele často nedostačující, proto chceme uživateli nabídnout jiný přístup k vyhledávání podle významu. Základním předpokladem sémantického vyhledávání na webu je znalost významu a vztahů mezi informacemi, kterou můžeme získat mimo jiné anotací webu uživatelem. Naším cílem je zpřístupnit uživateli srozumitelnou formou možnost anotace webové stránky. Na základě takto získaných dat, se potom můžeme učit a zjednodušit anotaci dalších podobných stránek.
 
Univerzita Karlova | Informační systém UK