Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Metody srovnavani pravidel ziskanych z dat
Název práce v češtině: Metody srovnavani pravidel ziskanych z dat
Název v anglickém jazyce: Methods for comparing rules extracted from data
Akademický rok vypsání: 2005/2006
Typ práce: diplomová práce
Jazyk práce: čeština
Ústav: Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel: prof. RNDr. Ing. Martin Holeňa, CSc.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 17.10.2005
Datum zadání: 17.10.2005
Datum a čas obhajoby: 21.05.2007 00:00
Datum odevzdání elektronické podoby:21.05.2007
Datum proběhlé obhajoby: 21.05.2007
Oponenti: doc. RNDr. Iveta Mrázová, CSc.
 
 
 
Zásady pro vypracování
Diplomand by se mel seznamit s hlavnimi pristupy k extrakci pravidel z dat, jak teoreticky, tak i prakticky. Mel by ziskat dobry prehled o dosud existujicich metodach mereni a srovnavani kvality extrahovanych mnozin pravidel. Vlastni tvurci prinos prace zacne analyzou prednosti a nedostatku jedotlivych existujicich metod, a to jednak teoreticky na zaklade vlastnosti techto metod, jednak rozborem vysledku ziskanych pri pouziti vybranych metod na realna data. Zavrsen by potom mel byt navrhem a praktickym overenim vhodnych modifikaci jedne ci vice z techto metod s cilem posileni jejich prednosti nebo oslabeni jejich nedostatku.
Seznam odborné literatury
I. Bruha. Quality of decision rules: empirical and statistical approaches. Informatica, 17: 233-243, 1993.

P. Dean, A. Famili. Comparative performance of rule quality measures in an induction system. Applied Intelligence, 7: 113-124, 1997.

D.J. Hand. Construction and assessment of classification rules, Wiley, New York, 1997.

M. Holeňa. Získávání pravidel z dat. Statistika, 83: 48-60, 2003.

K.A. Kaufman, R.S. Michalski. An adjustable descritption quality measure for pattern discovery using the AQ methodology. Journal of Intelligent Information systems, 14: 199-216, 2000.
Předběžná náplň práce
K nejrychleji se rozvijejicim informacnim technologiim patri od prvni poloviny 90. let tzv. dobyvani znalosti z dat ("data mining"). Pod timto nazvem se skryvaji metody ktere z neprehledne spousty primarnich dat, s niz se dnes clovek musi prakticky ve vsech oblastech potykat, umoznuji extrahovat prehledne mnoziny strukturovanych znalosti, v techto datech obsazenych. Jednim z nejpouzivanejsich zpusobu strukturovaneho vyjadreni znalosti obsazenych v datech jsou specialni typy logickych implikaci, tzv. pravidla. Pravidla lze ziskat nejjednodussim zpusobem z relativnich frekvenci vyskytu jednotlivych kombinaci hodnot atributu, lze je ale take odvodit z vysledku rady statistickych metod, napr. testu hypotez v kontingencnich tabulkach nebo regresni analyzy, i metod zalozenych na nestatistickych pristupech, napr. na neuronovych sitich, rozhodovacich stromech ci induktivni logice. Velky pocet ruznych pristupu k extrakci pravidel z dat s sebou prinasi jeden zavazny problem - pristupy zalozenymi na ruznych teoretickych principech lze totiz i ze stejnych dat extrahovat naprosto rozdilne mnoziny pravidel. Proto v poslednich letech rychle vzrusta vyznam metod umoznujicich merit a srovnavat kvalitu extrahovanych mnozin pravidel. Dalsi rozvoj takovych metod ma velkou dulezitost jiz i pro bezne prakticke vyuzivani existujicich systemu dobyvani zmalosti z dat, nebot dnes i ve velkych komercnich systemech byva implementovano cele spektrum ruznych pristupu k extrakci pravidel z dat. Prispevkem k rozvoji techto metod by mela byt i navrhovana diplomova prace.
 
Univerzita Karlova | Informační systém UK