Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 390)
Detail práce
   Přihlásit přes CAS
Korektor a extraktor HTML
Název práce v češtině: Korektor a extraktor HTML
Název v anglickém jazyce: HTML Correction and Extraction Program
Akademický rok vypsání: 2005/2006
Typ práce: bakalářská práce
Jazyk práce:
Ústav: Středisko informatické sítě a laboratoří (32-SISAL)
Vedoucí / školitel: RNDr. Libor Forst
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 07.11.2005
Datum zadání: 07.11.2005
Zásady pro vypracování
Vstupem programu je (typicky nevalidní) (X)HTML dokument. Úkolem programu je jednak provést korekci dokumentu (pro usnadnění následného zpracování) a jednak na základě konfigurace/parametrů provést extrakci definované části dokumentu (např. dokument s tabulkou s redukovanou množinou sloupců a řádek).
Seznam odborné literatury
http://www.w3.org/MarkUp/
http://www.w3.org/TR/1999/REC-html401-19991224/
http://www.w3.org/TR/2002/REC-xhtml1-20020801/
http://www.alistapart.com/stories/betterliving/
 
Univerzita Karlova | Informační systém UK