Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Moderní regresní metody při dobývání znalostí z dat
Název práce v češtině: Moderní regresní metody při dobývání znalostí z dat
Název v anglickém jazyce: Modern regression methods in data mining
Akademický rok vypsání: 2012/2013
Typ práce: diplomová práce
Jazyk práce:
Ústav: Katedra teoretické informatiky a matematické logiky (32-KTIML)
Vedoucí / školitel: prof. RNDr. Ing. Martin Holeňa, CSc.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 22.02.2013
Datum zadání: 02.03.2013
Datum potvrzení stud. oddělením: 09.05.2013
Zásady pro vypracování
Diplomant se nejdříve důkladně seznámí s teoretickými základy i konkrétními algoritmy nejdůležitějších typů moderní nelineární regrese. Poté se naučí pracovat s existujícími implementacemi některých těchto metod ve vývojovém prostředí Matlab, a tyto implementace vybraných metod otestuje na řadě mezinárodně používaných testovacích souborů, i na alespoň jednom souboru dat z reálné aplikace. Na závěr se pokusí navrhnout metodu, která by zvyšovala přesnost regresních stromů, jež jsou nejsrozumitelnějším z uvažovaných regresních modelů, bývají však ve srovnání s ostatními typicky o dost méně přesné.
Seznam odborné literatury
viz http://www.cs.cas.cz/~martin/diplomka19.html
Předběžná náplň práce
Regresní metody jsou metody prokládání funkcí z předem vymezených tříd empirickými daty. Proloženou funkci lze potom využít jednak ke studiu vztahů mezi jednotlivými proměnnými a zákonitostí, kterými se data řídí, jednak k predikci hodnot závisle proměnné v případech, které v datech nejsou zachyceny. Nejjednodušším typem regrese je regrese lineární, která se odedávna používala ve statistice, stejně jako i některé velmi jednoduché typy regrese nelineární, např. polynomiální regrese. Během posledních 20-30 let se však, díky růstu výkonnosti počítačů, velmi rychle rozvíjí mnohem důmyslnější typy nelineární regrese, např. regrese pomocí regresních stromů a regrese založená na umělých neuronových sítích či na jádrových funkcích. Tyto metody však již nejsou rozpracovávány v rámci statistiky, ale v rámci samostatných disciplin na pomezí matematiky a umělé inteligence.
Předběžná náplň práce v anglickém jazyce
Regression methods are methods of fitting functions from in advance delimited classes to empirical data. The fitted function can then be used on the one hand to study relationships between individual variables and the laws governing the data, on the other hand to predict the values of the dependent variable in cases not available in the data. The most simple kind of regression is the linear regression, which has been used in statistics for a long time, similarly to some very simple kinds of non-linear regression, e.g., polynomial regression. On the other hand, more sophisticated kinds of non-linear regression have been developing very fast during the last 20-30 years, due to the increasing power of computers, e.g., regression by means of regression trees or regression relying on neural networks or kernel functions. Those methods, however, are being elaborated not in statistics, but in separate disciplines on the border between mathematics and artificial intelligence.
 
Univerzita Karlova | Informační systém UK