Korektor a extraktor HTML
Název práce v češtině: | Korektor a extraktor HTML |
---|---|
Název v anglickém jazyce: | HTML Correction and Extraction Program |
Akademický rok vypsání: | 2005/2006 |
Typ práce: | bakalářská práce |
Jazyk práce: | |
Ústav: | Středisko informatické sítě a laboratoří (32-SISAL) |
Vedoucí / školitel: | RNDr. Libor Forst |
Řešitel: | skrytý![]() |
Datum přihlášení: | 07.11.2005 |
Datum zadání: | 07.11.2005 |
Zásady pro vypracování |
Vstupem programu je (typicky nevalidní) (X)HTML dokument. Úkolem programu je jednak provést korekci dokumentu (pro usnadnění následného zpracování) a jednak na základě konfigurace/parametrů provést extrakci definované části dokumentu (např. dokument s tabulkou s redukovanou množinou sloupců a řádek). |
Seznam odborné literatury |
http://www.w3.org/MarkUp/
http://www.w3.org/TR/1999/REC-html401-19991224/ http://www.w3.org/TR/2002/REC-xhtml1-20020801/ http://www.alistapart.com/stories/betterliving/ |