Extracting Linked Data from Excel Files
Název práce v češtině: | Extracting Linked Data from Excel Files |
---|---|
Název v anglickém jazyce: | Extracting Linked Data from Excel Files |
Klíčová slova: | RDF, data extraction, data scraping, tabular data |
Klíčová slova anglicky: | RDF, data extraction, data scraping, tabular data |
Akademický rok vypsání: | 2011/2012 |
Typ práce: | bakalářská práce |
Jazyk práce: | angličtina |
Ústav: | Katedra softwarového inženýrství (32-KSI) |
Vedoucí / školitel: | doc. Mgr. Martin Nečaský, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 04.11.2011 |
Datum zadání: | 07.11.2011 |
Datum potvrzení stud. oddělením: | 06.12.2011 |
Datum a čas obhajoby: | 02.09.2013 00:00 |
Datum odevzdání elektronické podoby: | 31.07.2013 |
Datum odevzdání tištěné podoby: | 01.08.2013 |
Datum proběhlé obhajoby: | 02.09.2013 |
Oponenti: | RNDr. David Bednárek, Ph.D. |
Zásady pro vypracování |
Linked Data [1,2] is a set of principles, which will in the future lead to a new generation of the Web. The new generation will be a current Web of Documents of data enriched with so called Web of Data. The basic Linked Data principle is publishing data packages on the Web with unique identifiers in a form of URI. The packages will be linked on each other, which will form the mentioned Web of Data.
The aim of this thesis is to create a scraping application of excel files on the web with export to RDF data. The author will propose own language for navigation in excel files. The language will allow users to specify what data should be scraped from a given set of excel files and how. The author will also perform various experiments on real excel data catalogued in Czech instance of CKAN catalogue. He will exploit experiences gained by other authors in other projects, e.g. [3]. |
Seznam odborné literatury |
[1] Christian Bizer, Tom Heath, Tim Berners-Lee: Linked Data - The Story So Far. Int. J. Semantic Web Inf. Syst. 5(3): 1-22 (2009) [http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf]
[2] http://linkeddata.org/ [3] Sören Auer, Christian Bizer, Georgi Kobilarov, Jens Lehmann, Richard Cyganiak and Zachary Ives. DBpedia: A Nucleus for a Web of Open Data. THE SEMANTIC WEB Lecture Notes in Computer Science, 2007, Volume 4825/2007, 722-735, DOI: 10.1007/978-3-540-76298-0_52 |