Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Automatizovaná extracia informácií z internetu
Název práce v jazyce práce (slovenština): Automatizovaná extracia informácií z internetu
Název práce v češtině: Automatizovaná extracia informácií z internetu
Název v anglickém jazyce: Automated web information extraction
Klíčová slova: extrakce dat z Webu, programování demonstrací
Klíčová slova anglicky: Web Scraping, Programming by Demonstration
Akademický rok vypsání: 2009/2010
Typ práce: diplomová práce
Jazyk práce: slovenština
Ústav: Katedra softwaru a výuky informatiky (32-KSVI)
Vedoucí / školitel: RNDr. František Mráz, CSc.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 03.03.2010
Datum zadání: 03.03.2010
Datum a čas obhajoby: 30.05.2011 00:00
Datum odevzdání elektronické podoby:15.04.2011
Datum odevzdání tištěné podoby:15.04.2011
Datum proběhlé obhajoby: 30.05.2011
Oponenti: RNDr. Jiří Dokulil, Ph.D.
 
 
 
Zásady pro vypracování
Webové stránky sprístupňujú ohromné množstvo informácií. Často sa jedná o stránky generované z dát uložených v databázach. Pritom je kladený dôraz na zobrazenie informácií, ale nie na ich strojové spracovanie. Cieľom diplomovej práce je navrhnúť a implementovať prototyp systému na získavanie dát z dynamicky generovaných webových stránok technikou programovania demonštráciou (programming by demonstration). Takýto systém by mal umožniť užívateľovi ukázať, ako má systém postupovať pri zbieraní informácií z danej webovej stránky (s využitím obmedzenej sady operácií pomocou klávesnice, prípadne myši). Na základe takejto ukážky by systém mal odvodiť postup, ako získavať informácie na podobných stránkach. Implementovaný systém by mal dokázať pozbierať pre užívateľa relevantné informácie z podobných stránok napríklad do tvaru jednoduchej tabuľky vhodnej na ďalšie strojové spracovanie.
Seznam odborné literatury
A. Cypher, D. C. Halbert, D. Kurlander, H. Lieberman, D. Maulsby, B. A. Myers, A. Turransky (Eds.): Watch what I do: programming by demonstration, 1993, MIT Press, Cambridge, MA, USA.

H. Lieberman: Your Wish is My Command: Programming By Example, 2001, Morgan Kaufmann.
 
Univerzita Karlova | Informační systém UK