SubjectsSubjects(version: 945)
Course, academic year 2023/2024
   Login via CAS
Applied statistics in anthropology - MB110P95
Title: Aplikovaná statistika v antropologii
Czech title: Aplikovaná statistika v antropologii
Guaranteed by: Department of Anthropology and Human Genetics (31-110)
Faculty: Faculty of Science
Actual: from 2017
Semester: summer
E-Credits: 4
Examination process: summer s.:combined
Hours per week, examination: summer s.:2/2, C+Ex [HT]
Capacity: 10
Min. number of students: 5
4EU+: no
Virtual mobility / capacity: no
State of the course: taught
Language: Czech
Note: enabled for web enrollment
Guarantor: Ing. Martin Hill, DrSc.
Teacher(s): Ing. Martin Hill, DrSc.
Annotation - Czech
Last update: Mgr. Lenka Dupejová (05.03.2019)
Předmět je určen k praktickému zvládnutí zpracování jedno- a vícerozměrných dat v antropologii.
Literature - Czech
Last update: Mgr. Lenka Dupejová (05.03.2019)

Milan Meloun; Jiří Militký, Interaktivní statistická analýza dat, Karolinum, 2012

Milan Meloun; Jiří Militký, Kompendium statistického zpracování dat, Karolinum, 2012

Martin Hill; Milan Meloun; Jiří Militký, Statistická analýza vícerozměrných dat v příkladech, Karolinum, 2017

Requirements to the exam - Czech
Last update: Mgr. Lenka Dupejová (05.03.2019)

a) Zápočtový test: Podle povahy vstupních dat a otázky v zadání vybrat vhodnou metodiku pro zpracování negaussovských dat s přítomností nehomogenit, a to jednak vhodnou metodou analýzy rozptylu následovanou testy vícenásobného porovnávání (příklad 1), dále vícenásobnou regresí či logistickou regresí (příklad 2) a konečně korelační analýzou dat následovanou analýzou hlavních komponent, faktorovou analýzou či vícerozměrnou regresí s redukcí dimenzionality (příklad 3).

b) Ústní zkouška: Prověření porozumění zvoleným postupům a správnosti interpretace výsledků.

Syllabus - Czech
Last update: Mgr. Lenka Dupejová (05.03.2019)

Jednorozměrný výběr (přednáška a cvičení 2 hodiny)

Základní pojmy (průměr, medián, modus, polosuma, rozptyl, směrodatná odchylka, standardní chyba průměru, intervaly spolehlivosti, percentily, šikmost, špičatost, typy rozdělení)

Průzkumová analýza jednorozměrných dat (homogenita, odlehlé body, „nehomogenita" a nehomogenita, diagnostické grafy)

Řešení problému nesymetrie a nehomogenity (transformace, neparametrické metody)

Odhady střední hodnoty a rozptýlení

Analýza malých výběrů (Hornova metoda pivotů)

Vztahy mezi metrickou proměnnou a kategoriálními proměnnými (přednáška a cvičení 8 hodin)

Nepárové testy (předpoklady, řešení problémů nesymetrie nehomogenity a nehomogenity rozptylu, testy shodnosti rozptylu, testy shodnosti rozdělení, neparametrický Mann-Whitneyův test)

Párové testy (předpoklady, řešení problémů nesymetrie a nehomogenity, neparametrický Wilcoxonův test)

Jednofaktorová ANOVA (pojem vysvětlený a nevysvětlený rozptyl, předpoklady, řešení problémů nesymetrie, nehomogenity rozdělení a nehomogenity rozptylu, testy, shodnosti rozptylu, neparametrická ANOVA (Kruskal-Wallisův test), testy vícenásobného porovnávání)

Vícefaktorová ANOVA bez opakování (interakce mezi faktory)

ANOVA s opakováním

Cross-over design

Metrická závisle proměnná vs. metrické i nemetrické nezávisle proměnné (přednáška a cvičení 1 hodina)

ANCOVA (faktory, kovariáty, interakce, podmínka nevýznamných interakcí kovariát-faktor)

Lineární modely (interakce mezi kovariáty a mezi kovariáty a faktory)

Vztahy mezi metrickými proměnnými (přednáška a cvičení 3 hodiny)

Vícerozměrné normální rozdělení (Mahalanobisova vzdálenost, problém vícerozměrných nehomogenit, detekce a eliminace nehomogenit, transformace směrem k symetrii a homoscedasticitě u vícerozměrných dat)

Párové korelace (předpoklady, řešení problémů nesymetrie, nehomogenity a nehomogenity rozptylu, testy shodnosti rozptylu, pořadová Spearmanova korelace, transformace)

Parciální korelace

Vztahy mezi metrickými závisle proměnnými a metrickými nezávisle proměnnými (přednáška a cvičení 6 hodin)

Lineární regrese (linearizace vztahů, předpoklady, řešení problémů nesymetrie, nehomogenity, nehomogenity rozptylu u závisle a nezávisle proměnných, diagnostické grafy)

Vícenásobná lineární regrese (stepwise regrese, polynomická regrese)

Vztahy mezi kategoriálními závisle proměnnými a metrickými i kategoriálními nezávisle proměnnými (přednáška a cvičení 2 hodiny)

Logistická regrese (robustnost k rozdělení dat, odhad pravděpodobnosti příslušnosti do skupiny, robustní alternativa k nepárovým testům, stepwise logistická regrese, 2x2 kontingenční tabulka, jako výsledek logistické regrese, pojmy sensitivita specificita pozitivní prediktivní hodnota negativní, prediktivní hodnota pravděpodobnostní poměr, odds ratio, relativní riziko)

Vztahy mezi kategoriálními proměnnými (přednáška a cvičení 1 hodina)

Kategorizace metrických dat

Kontingenční tabulky

χ2-test, Fisherův exaktní test

Frekvenční analýza (logaritmicko-lineární modely)

Vícerozměrné metody s redukcí dimenzionality (přednáška a cvičení 3 hodiny)

Analýza hlavních komponent (PCA) (predikce chybějících hodnot, krátký cyklus, rotace hlavních komponent)

Faktorová analýza (rotace faktorů)

Vícerozměrná regrese s redukcí dimenzionality (PLS, OPLS, O2PLS)

Analýza shluků (hierarchické shlukování, shlukování a nesymetrie v datech, PCA a shlukování)

Využití jazyka R v analýze dat (přednáška a cvičení 3 hodiny)

Řešení některých úloh z předchozích lekcí v jazyce R

 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html