Témata prací (Výběr práce)

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Metody srovnavani pravidel ziskanych z dat

Název práce v češtině:	Metody srovnavani pravidel ziskanych z dat
Název v anglickém jazyce:	Methods for comparing rules extracted from data
Akademický rok vypsání:	2005/2006
Typ práce:	diplomová práce
Jazyk práce:	čeština
Ústav:	Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel:	prof. RNDr. Ing. Martin Holeňa, CSc.
Řešitel:	skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení:	17.10.2005
Datum zadání:	17.10.2005
Datum a čas obhajoby:	21.05.2007 00:00
Datum odevzdání elektronické podoby:	21.05.2007
Datum proběhlé obhajoby:	21.05.2007
Oponenti:	doc. RNDr. Iveta Mrázová, CSc.

Zásady pro vypracování

Diplomand by se mel seznamit s hlavnimi pristupy k extrakci pravidel z dat, jak teoreticky, tak i prakticky. Mel by ziskat dobry prehled o dosud existujicich metodach mereni a srovnavani kvality extrahovanych mnozin pravidel. Vlastni tvurci prinos prace zacne analyzou prednosti a nedostatku jedotlivych existujicich metod, a to jednak teoreticky na zaklade vlastnosti techto metod, jednak rozborem vysledku ziskanych pri pouziti vybranych metod na realna data. Zavrsen by potom mel byt navrhem a praktickym overenim vhodnych modifikaci jedne ci vice z techto metod s cilem posileni jejich prednosti nebo oslabeni jejich nedostatku.

Seznam odborné literatury

I. Bruha. Quality of decision rules: empirical and statistical approaches. Informatica, 17: 233-243, 1993.

P. Dean, A. Famili. Comparative performance of rule quality measures in an induction system. Applied Intelligence, 7: 113-124, 1997.

D.J. Hand. Construction and assessment of classification rules, Wiley, New York, 1997.

M. Holeňa. Získávání pravidel z dat. Statistika, 83: 48-60, 2003.

K.A. Kaufman, R.S. Michalski. An adjustable descritption quality measure for pattern discovery using the AQ methodology. Journal of Intelligent Information systems, 14: 199-216, 2000.

Předběžná náplň práce

K nejrychleji se rozvijejicim informacnim technologiim patri od prvni poloviny 90. let tzv. dobyvani znalosti z dat ("data mining"). Pod timto nazvem se skryvaji metody ktere z neprehledne spousty primarnich dat, s niz se dnes clovek musi prakticky ve vsech oblastech potykat, umoznuji extrahovat prehledne mnoziny strukturovanych znalosti, v techto datech obsazenych. Jednim z nejpouzivanejsich zpusobu strukturovaneho vyjadreni znalosti obsazenych v datech jsou specialni typy logickych implikaci, tzv. pravidla. Pravidla lze ziskat nejjednodussim zpusobem z relativnich frekvenci vyskytu jednotlivych kombinaci hodnot atributu, lze je ale take odvodit z vysledku rady statistickych metod, napr. testu hypotez v kontingencnich tabulkach nebo regresni analyzy, i metod zalozenych na nestatistickych pristupech, napr. na neuronovych sitich, rozhodovacich stromech ci induktivni logice. Velky pocet ruznych pristupu k extrakci pravidel z dat s sebou prinasi jeden zavazny problem - pristupy zalozenymi na ruznych teoretickych principech lze totiz i ze stejnych dat extrahovat naprosto rozdilne mnoziny pravidel. Proto v poslednich letech rychle vzrusta vyznam metod umoznujicich merit a srovnavat kvalitu extrahovanych mnozin pravidel. Dalsi rozvoj takovych metod ma velkou dulezitost jiz i pro bezne prakticke vyuzivani existujicich systemu dobyvani zmalosti z dat, nebot dnes i ve velkych komercnich systemech byva implementovano cele spektrum ruznych pristupu k extrakci pravidel z dat. Prispevkem k rozvoji techto metod by mela byt i navrhovana diplomova prace.