Metody srovnavani pravidel ziskanych z dat
Název práce v češtině: | Metody srovnavani pravidel ziskanych z dat |
---|---|
Název v anglickém jazyce: | Methods for comparing rules extracted from data |
Akademický rok vypsání: | 2005/2006 |
Typ práce: | diplomová práce |
Jazyk práce: | čeština |
Ústav: | Katedra softwarového inženýrství (32-KSI) |
Vedoucí / školitel: | prof. RNDr. Ing. Martin Holeňa, CSc. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 17.10.2005 |
Datum zadání: | 17.10.2005 |
Datum a čas obhajoby: | 21.05.2007 00:00 |
Datum odevzdání elektronické podoby: | 21.05.2007 |
Datum proběhlé obhajoby: | 21.05.2007 |
Oponenti: | doc. RNDr. Iveta Mrázová, CSc. |
Zásady pro vypracování |
Diplomand by se mel seznamit s hlavnimi pristupy k extrakci pravidel z dat, jak teoreticky, tak i prakticky. Mel by ziskat dobry prehled o dosud existujicich metodach mereni a srovnavani kvality extrahovanych mnozin pravidel. Vlastni tvurci prinos prace zacne analyzou prednosti a nedostatku jedotlivych existujicich metod, a to jednak teoreticky na zaklade vlastnosti techto metod, jednak rozborem vysledku ziskanych pri pouziti vybranych metod na realna data. Zavrsen by potom mel byt navrhem a praktickym overenim vhodnych modifikaci jedne ci vice z techto metod s cilem posileni jejich prednosti nebo oslabeni jejich nedostatku.
|
Seznam odborné literatury |
I. Bruha. Quality of decision rules: empirical and statistical approaches. Informatica, 17: 233-243, 1993.
P. Dean, A. Famili. Comparative performance of rule quality measures in an induction system. Applied Intelligence, 7: 113-124, 1997. D.J. Hand. Construction and assessment of classification rules, Wiley, New York, 1997. M. Holeňa. Získávání pravidel z dat. Statistika, 83: 48-60, 2003. K.A. Kaufman, R.S. Michalski. An adjustable descritption quality measure for pattern discovery using the AQ methodology. Journal of Intelligent Information systems, 14: 199-216, 2000. |
Předběžná náplň práce |
K nejrychleji se rozvijejicim informacnim technologiim patri od prvni poloviny 90. let tzv. dobyvani znalosti z dat ("data mining"). Pod timto nazvem se skryvaji metody ktere z neprehledne spousty primarnich dat, s niz se dnes clovek musi prakticky ve vsech oblastech potykat, umoznuji extrahovat prehledne mnoziny strukturovanych znalosti, v techto datech obsazenych. Jednim z nejpouzivanejsich zpusobu strukturovaneho vyjadreni znalosti obsazenych v datech jsou specialni typy logickych implikaci, tzv. pravidla. Pravidla lze ziskat nejjednodussim zpusobem z relativnich frekvenci vyskytu jednotlivych kombinaci hodnot atributu, lze je ale take odvodit z vysledku rady statistickych metod, napr. testu hypotez v kontingencnich tabulkach nebo regresni analyzy, i metod zalozenych na nestatistickych pristupech, napr. na neuronovych sitich, rozhodovacich stromech ci induktivni logice. Velky pocet ruznych pristupu k extrakci pravidel z dat s sebou prinasi jeden zavazny problem - pristupy zalozenymi na ruznych teoretickych principech lze totiz i ze stejnych dat extrahovat naprosto rozdilne mnoziny pravidel. Proto v poslednich letech rychle vzrusta vyznam metod umoznujicich merit a srovnavat kvalitu extrahovanych mnozin pravidel. Dalsi rozvoj takovych metod ma velkou dulezitost jiz i pro bezne prakticke vyuzivani existujicich systemu dobyvani zmalosti z dat, nebot dnes i ve velkych komercnich systemech byva implementovano cele spektrum ruznych pristupu k extrakci pravidel z dat. Prispevkem k rozvoji techto metod by mela byt i navrhovana diplomova prace. |