Thesis (Selection of subject)Thesis (Selection of subject)(version: 390)
Thesis details
   Login via CAS
Korektor a extraktor HTML
Thesis title in Czech: Korektor a extraktor HTML
Thesis title in English: HTML Correction and Extraction Program
Academic year of topic announcement: 2005/2006
Thesis type: Bachelor's thesis
Thesis language:
Department: Network and Labs Management Center (32-SISAL)
Supervisor: RNDr. Libor Forst
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 07.11.2005
Date of assignment: 07.11.2005
Guidelines
Vstupem programu je (typicky nevalidní) (X)HTML dokument. Úkolem programu je jednak provést korekci dokumentu (pro usnadnění následného zpracování) a jednak na základě konfigurace/parametrů provést extrakci definované části dokumentu (např. dokument s tabulkou s redukovanou množinou sloupců a řádek).
References
http://www.w3.org/MarkUp/
http://www.w3.org/TR/1999/REC-html401-19991224/
http://www.w3.org/TR/2002/REC-xhtml1-20020801/
http://www.alistapart.com/stories/betterliving/
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html