Korektor a extraktor HTML
Thesis title in Czech: | Korektor a extraktor HTML |
---|---|
Thesis title in English: | HTML Correction and Extraction Program |
Academic year of topic announcement: | 2005/2006 |
Thesis type: | Bachelor's thesis |
Thesis language: | |
Department: | Network and Labs Management Center (32-SISAL) |
Supervisor: | RNDr. Libor Forst |
Author: | hidden![]() |
Date of registration: | 07.11.2005 |
Date of assignment: | 07.11.2005 |
Guidelines |
Vstupem programu je (typicky nevalidní) (X)HTML dokument. Úkolem programu je jednak provést korekci dokumentu (pro usnadnění následného zpracování) a jednak na základě konfigurace/parametrů provést extrakci definované části dokumentu (např. dokument s tabulkou s redukovanou množinou sloupců a řádek). |
References |
http://www.w3.org/MarkUp/
http://www.w3.org/TR/1999/REC-html401-19991224/ http://www.w3.org/TR/2002/REC-xhtml1-20020801/ http://www.alistapart.com/stories/betterliving/ |