Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Extracting Linked Data from Excel Files
Název práce v češtině: Extracting Linked Data from Excel Files
Název v anglickém jazyce: Extracting Linked Data from Excel Files
Klíčová slova: RDF, data extraction, data scraping, tabular data
Klíčová slova anglicky: RDF, data extraction, data scraping, tabular data
Akademický rok vypsání: 2011/2012
Typ práce: bakalářská práce
Jazyk práce: angličtina
Ústav: Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel: doc. Mgr. Martin Nečaský, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 04.11.2011
Datum zadání: 07.11.2011
Datum potvrzení stud. oddělením: 06.12.2011
Datum a čas obhajoby: 02.09.2013 00:00
Datum odevzdání elektronické podoby:31.07.2013
Datum odevzdání tištěné podoby:01.08.2013
Datum proběhlé obhajoby: 02.09.2013
Oponenti: RNDr. David Bednárek, Ph.D.
 
 
 
Zásady pro vypracování
Linked Data [1,2] is a set of principles, which will in the future lead to a new generation of the Web. The new generation will be a current Web of Documents of data enriched with so called Web of Data. The basic Linked Data principle is publishing data packages on the Web with unique identifiers in a form of URI. The packages will be linked on each other, which will form the mentioned Web of Data.

The aim of this thesis is to create a scraping application of excel files on the web with export to RDF data. The author will propose own language for navigation in excel files. The language will allow users to specify what data should be scraped from a given set of excel files and how. The author will also perform various experiments on real excel data catalogued in Czech instance of CKAN catalogue. He will exploit experiences gained by other authors in other projects, e.g. [3].
Seznam odborné literatury
[1] Christian Bizer, Tom Heath, Tim Berners-Lee: Linked Data - The Story So Far. Int. J. Semantic Web Inf. Syst. 5(3): 1-22 (2009) [http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf]
[2] http://linkeddata.org/
[3] Sören Auer, Christian Bizer, Georgi Kobilarov, Jens Lehmann, Richard Cyganiak and Zachary Ives. DBpedia: A Nucleus for a Web of Open Data. THE SEMANTIC WEB Lecture Notes in Computer Science, 2007, Volume 4825/2007, 722-735, DOI: 10.1007/978-3-540-76298-0_52
 
Univerzita Karlova | Informační systém UK