PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Aplikovaná statistika v antropologii - MB110P95
Anglický název: Applied statistics in anthropology
Český název: Aplikovaná statistika v antropologii
Zajišťuje: Katedra antropologie a genetiky člověka (31-110)
Fakulta: Přírodovědecká fakulta
Platnost: od 2017
Semestr: letní
E-Kredity: 4
Způsob provedení zkoušky: letní s.:kombinovaná
Rozsah, examinace: letní s.:2/2, Z+Zk [HT]
Počet míst: 10
Minimální obsazenost: 5
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: čeština
Poznámka: povolen pro zápis po webu
Garant: Ing. Martin Hill, DrSc.
Vyučující: Ing. Martin Hill, DrSc.
Anotace
Poslední úprava: Mgr. Lenka Dupejová (05.03.2019)
Předmět je určen k praktickému zvládnutí zpracování jedno- a vícerozměrných dat v antropologii.
Literatura
Poslední úprava: Mgr. Lenka Dupejová (05.03.2019)

Milan Meloun; Jiří Militký, Interaktivní statistická analýza dat, Karolinum, 2012

Milan Meloun; Jiří Militký, Kompendium statistického zpracování dat, Karolinum, 2012

Martin Hill; Milan Meloun; Jiří Militký, Statistická analýza vícerozměrných dat v příkladech, Karolinum, 2017

Požadavky ke zkoušce
Poslední úprava: Mgr. Lenka Dupejová (05.03.2019)

a) Zápočtový test: Podle povahy vstupních dat a otázky v zadání vybrat vhodnou metodiku pro zpracování negaussovských dat s přítomností nehomogenit, a to jednak vhodnou metodou analýzy rozptylu následovanou testy vícenásobného porovnávání (příklad 1), dále vícenásobnou regresí či logistickou regresí (příklad 2) a konečně korelační analýzou dat následovanou analýzou hlavních komponent, faktorovou analýzou či vícerozměrnou regresí s redukcí dimenzionality (příklad 3).

b) Ústní zkouška: Prověření porozumění zvoleným postupům a správnosti interpretace výsledků.

Sylabus
Poslední úprava: Mgr. Lenka Dupejová (05.03.2019)

Jednorozměrný výběr (přednáška a cvičení 2 hodiny)

Základní pojmy (průměr, medián, modus, polosuma, rozptyl, směrodatná odchylka, standardní chyba průměru, intervaly spolehlivosti, percentily, šikmost, špičatost, typy rozdělení)

Průzkumová analýza jednorozměrných dat (homogenita, odlehlé body, „nehomogenita" a nehomogenita, diagnostické grafy)

Řešení problému nesymetrie a nehomogenity (transformace, neparametrické metody)

Odhady střední hodnoty a rozptýlení

Analýza malých výběrů (Hornova metoda pivotů)

Vztahy mezi metrickou proměnnou a kategoriálními proměnnými (přednáška a cvičení 8 hodin)

Nepárové testy (předpoklady, řešení problémů nesymetrie nehomogenity a nehomogenity rozptylu, testy shodnosti rozptylu, testy shodnosti rozdělení, neparametrický Mann-Whitneyův test)

Párové testy (předpoklady, řešení problémů nesymetrie a nehomogenity, neparametrický Wilcoxonův test)

Jednofaktorová ANOVA (pojem vysvětlený a nevysvětlený rozptyl, předpoklady, řešení problémů nesymetrie, nehomogenity rozdělení a nehomogenity rozptylu, testy, shodnosti rozptylu, neparametrická ANOVA (Kruskal-Wallisův test), testy vícenásobného porovnávání)

Vícefaktorová ANOVA bez opakování (interakce mezi faktory)

ANOVA s opakováním

Cross-over design

Metrická závisle proměnná vs. metrické i nemetrické nezávisle proměnné (přednáška a cvičení 1 hodina)

ANCOVA (faktory, kovariáty, interakce, podmínka nevýznamných interakcí kovariát-faktor)

Lineární modely (interakce mezi kovariáty a mezi kovariáty a faktory)

Vztahy mezi metrickými proměnnými (přednáška a cvičení 3 hodiny)

Vícerozměrné normální rozdělení (Mahalanobisova vzdálenost, problém vícerozměrných nehomogenit, detekce a eliminace nehomogenit, transformace směrem k symetrii a homoscedasticitě u vícerozměrných dat)

Párové korelace (předpoklady, řešení problémů nesymetrie, nehomogenity a nehomogenity rozptylu, testy shodnosti rozptylu, pořadová Spearmanova korelace, transformace)

Parciální korelace

Vztahy mezi metrickými závisle proměnnými a metrickými nezávisle proměnnými (přednáška a cvičení 6 hodin)

Lineární regrese (linearizace vztahů, předpoklady, řešení problémů nesymetrie, nehomogenity, nehomogenity rozptylu u závisle a nezávisle proměnných, diagnostické grafy)

Vícenásobná lineární regrese (stepwise regrese, polynomická regrese)

Vztahy mezi kategoriálními závisle proměnnými a metrickými i kategoriálními nezávisle proměnnými (přednáška a cvičení 2 hodiny)

Logistická regrese (robustnost k rozdělení dat, odhad pravděpodobnosti příslušnosti do skupiny, robustní alternativa k nepárovým testům, stepwise logistická regrese, 2x2 kontingenční tabulka, jako výsledek logistické regrese, pojmy sensitivita specificita pozitivní prediktivní hodnota negativní, prediktivní hodnota pravděpodobnostní poměr, odds ratio, relativní riziko)

Vztahy mezi kategoriálními proměnnými (přednáška a cvičení 1 hodina)

Kategorizace metrických dat

Kontingenční tabulky

χ2-test, Fisherův exaktní test

Frekvenční analýza (logaritmicko-lineární modely)

Vícerozměrné metody s redukcí dimenzionality (přednáška a cvičení 3 hodiny)

Analýza hlavních komponent (PCA) (predikce chybějících hodnot, krátký cyklus, rotace hlavních komponent)

Faktorová analýza (rotace faktorů)

Vícerozměrná regrese s redukcí dimenzionality (PLS, OPLS, O2PLS)

Analýza shluků (hierarchické shlukování, shlukování a nesymetrie v datech, PCA a shlukování)

Využití jazyka R v analýze dat (přednáška a cvičení 3 hodiny)

Řešení některých úloh z předchozích lekcí v jazyce R

 
Univerzita Karlova | Informační systém UK