Přednáška seznámí posluchače s moderními algoritmy a principy
používanými v oblasti vyhledávání informací v rozsáhlých datových
kolekcích. Posluchači získají praktické vědomosti a zkušenosti s
prováděním a vyhodnocováním experimentů na reálných datech. Zvláštní
pozornost je věnována vyhledávání informací na webu.
Poslední úprava: T_UFAL (13.05.2014)
The course introduces modern algorithms and principles used in the field
of information retrieval in large data collections. The students will
gain practical knowledge and experience with experimentation and
evaluation on real data. A special focus is given to web search.
Podmínky zakončení předmětu -
Poslední úprava: doc. RNDr. Pavel Pecina, Ph.D. (04.05.2022)
K absolvování předmětu je zapotřebí zápočet i zkouška.
Zápočet bude udělen po splnění dvou domácích úkolů.
Výsledná známka bude záviset na výsledcích zkoušky a řešení domácích úkolů.
Poslední úprava: doc. RNDr. Pavel Pecina, Ph.D. (04.05.2022)
Both the course credit and exam are required to complete the course.
The course credit will be given after completing two homework assignments.
The final grade will be based on the results of the exam and homework.
Literatura -
Poslední úprava: doc. RNDr. Pavel Pecina, Ph.D. (04.05.2022)
Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008. ISBN 0521865719.
Poslední úprava: doc. RNDr. Pavel Pecina, Ph.D. (04.05.2022)
Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008. ISBN 0521865719.
Požadavky ke zkoušce -
Poslední úprava: doc. RNDr. Pavel Pecina, Ph.D. (04.05.2022)
Zkouška je formou písemného testu s přibližně 20 otázkami vyžadujícími stručné odpovědi na témata diskutovaná během přednášek.
Poslední úprava: doc. RNDr. Pavel Pecina, Ph.D. (04.05.2022)
The exam is in a form of a written test with approximately 20 short-answer questions covered by the topics discussed during the course.
Sylabus -
Poslední úprava: doc. RNDr. Pavel Pecina, Ph.D. (04.05.2022)
Úvod, základní pojmy a principy
Boolský model
Indexování
Vektorový model
Evaluace ve vyhledávání informací
Rozšiřování dotazů
Pravděpodobnostní modely
Jazykové modely
Klasifikace textu
Shlukování dokumentů
Hledání na webu
Hledání blízkých duplicit
Poslední úprava: doc. RNDr. Pavel Pecina, Ph.D. (04.05.2022)