Last update: PhDr. Ing. Petr Soukup, Ph.D. (07.10.2010)
The course is follow up of Statistics I and Statistics II. This course is focused on advanced statistical techniques and data analysis in SPSS.
Last update: PhDr. Ing. Petr Soukup, Ph.D. (25.09.2015)
Kurz navazuje na kurzy Statistika I, II a rozvíjí dovednost analýzy dat a rozšiřuje znalosti analytických metod. Cvičení jsou vedena na počítačích v prostředí SPSS, kde studenti analyzují data z reálných sociologických šetření. Z každého cvičení je zadán domácí úkol, student musí odeslat 8 úkolů k hodnocení cvičícímu (vždy do pondělního poledne v týdnu následujícím po cvičení), každý úkol je hodnocen 0-10 body, pro připuštění ke zkoušce je nutno získat min. 70 % (tj. 56) bodů z 8 nejlepších úkolů. V průběhu semestru je psán na cvičeních test (nutno splnit každý min. na 70%, možnost 1x opakovat v průběhu zkouškového období). Na konci předmětu se skládá zkouška z odpřednášené látky (písemná). Termíny zkoušky jsou vypisovány v SIS UK, v případě dvojího neúspěchu u zkoušky se koná ústní zkouška před komisí.
Aim of the course -
Last update: Mgr. Vladimír Soukup, Ph.D. (10.04.2008)
The goal is to broaden knowladges of stastical techniques (esp. exploratory ones) and to broaden analytical skills in SPSS.
Last update: PhDr. Ing. Petr Soukup, Ph.D. (25.09.2015)
Cílem kurzu je doplnit znalosti stastiky o další techniky zejména exploračního typu a rozvíjení analytických dovedností v SPSS.
Literature -
Last update: Mgr. Vladimír Soukup, Ph.D. (26.06.2008)
Obligatory:
Hendl J. 2004. Přehled statistických metod zpracování dat. Praha: Portál
HINDLS, Richard - HRONOVÁ, Stanislava - SEGER, Jan. 2004: Statistika pro ekonomy. 5. vydání, Professional Publishing 2004, Praha
Recommended:
Hebák, Hustopecký, Malá. 2005: Vícerozměrné statistické metody (2), Informatorium.
Hebák a kol. 2005: Vícerozměrné statistické metody (3), Informatorium.
HINDLS, Richard, HRONOVÁ, Stanislava, NOVÁK, Ilja. 2000: Metody statistické analýzy pro ekonomy. 2. přepr. vyd. Praha : Management Press
HINDLS, Richard - HRONOVÁ, Stanislava - SEGER, Jan. 2004: Statistika pro ekonomy. 5. vydání, Professional Publishing 2004, Praha
Elektronic textbook:
StatSoft, Inc. (2004). Electronic Statistics Textbook. Tulsa, OK: StatSoft.
http://www.statsoft.com/textbook/stathome.html
Last update: PhDr. Ing. Petr Soukup, Ph.D. (25.09.2015)
Povinná: Mareš, Rabušic, Soukup. Analýza sociálněvědních dat (nejen) v SPSS. 2015. muniPRESS, Brno.
Soukup, P., Rabušic, L. 2007. Několik poznámek k jedné obsesi českých sociálních věd - statistické významnosti. Sociologický časopis/ Czech Sociological Review, 43 (2): 379-395
Last update: Mgr. Vladimír Soukup, Ph.D. (10.04.2008)
lecture/exercise
Last update: Mgr. Vladimír Soukup, Ph.D. (10.04.2008)
přednáška/cvičení
Requirements to the exam - Czech
Last update: PhDr. Ing. Petr Soukup, Ph.D. (30.10.2019)
Z každého cvičení je zadán domácí úkol, student musí odeslat 8 úkolů k hodnocení cvičícímu (vždy do pondělního poledne v týdnu následujícím po cvičení), každý úkol je hodnocen 0-10 body, pro připuštění ke zkoušce je nutno získat min. 70 % (tj. 56) bodů z 8 nejlepších úkolů. V průběhu semestru je psán na cvičeních test (nutno splnit každý min. na 70%, možnost 1x opakovat v průběhu zkouškového období). Na konci předmětu se skládá zkouška z odpřednášené látky (písemná). Termíny zkoušky jsou vypisovány v SIS UK, v případě dvojího neúspěchu u zkoušky se koná ústní zkouška před komisí.
Syllabus -
Last update: Mgr. Vladimír Soukup, Ph.D. (26.06.2008)
2. Covariance and correlation. Bivariate, multivariate and partial correlation. Spurious correlation. Correlation matrix.
3. Factor analysis. Basics, number of factors, tests, Extraction and rotation.
4. Factor analysis. Typologies, control of scales. Realibilty of scales. Factor scores.
5. Cluster analysis, basics, clustering of cases. Measurement of distances. Hierarchical clustering.
6. Clustrer membership. Typologies. K-means cluster. Clustering of variables.
7. Discrimination analysis.
8. Time series. Descriptives in time series. Types of time series.
9. Moving averages. Trend functions. Seasonal models of time series.
10. Missing values, results, handling and replacing. Data weighting.
11. Open ended questions and data analysis. Coding, duplicities. Frequency and contingency table.
12. Random and non-random samples and influence on statistical techniques. Small samples, samples from small populations.
Last update: PhDr. Ing. Petr Soukup, Ph.D. (25.09.2015)
1. Vícenásobná regrese-práce s kategoriálními vysvětlujícími proměnnými (umělé proměnné). Nesplnění požadavků klasického lineárního modelu (multikolinearita)-identifikace a možná řešení. (kap. 10,11) 2. Kovariance a korelace. Korelační analýza, párová, dílčí a vícenásobná korelace. Problém zdánlivé závislosti. Vztah mezi regresním koeficientem a korelačním koeficientem. Korelační matice a její využití ve statistice. (kap. 9) 3. Faktorová analýza aneb hledání skrytých faktorů. Předpoklady použití, alternativy při nesplnění. Určení počtu faktorů. Prvotní řešení a možnost rotace, tvorba typů, kontrola a tvorba škál. Exkurz-reliabilita škál a její měření.Možnosti rotace faktorů a pojmenování faktorů. Využití faktorových skóre v dalších statistických metodách. (kap. 13)
4. Tabulky a grafy pro prezentaci výsledků. Třídící a tříděné proměnné. Ukázky modulu Custom Tables. (dodatek1)
5. Seskupovací analýza, podstata metody, seskupování případů a proměnných. Metody měření vzdáleností ve vícerozměrném prostoru. Hierarchické seskupování. Metody měření vzdálenosti mezi shluky. Standardizace proměnných. (kap. 14) 6. Výstupy seskupování, určení příslušnosti a využití klasifikace v dalších statistických metodách. "Rychlá" seskupovací analýza-K-means cluster-podstata procedury, možnosti využití. (kap. 14) 7. Diskriminační analýza- předpoklady použití, alternativy při nesplnění. Diskriminační skóre a rozdělení do skupin. Možnost predikce skupinové příslušnosti u nových případů. (Hebák a kol., 2. díl) 8. Příprava datového souboru - logické čištění dat, práce s filtry. Využití příkazů IF a DO IF. SORT, SPLIT FILE,SELECT, TEMPORARY.Agregace dat. Spojování dat - připojování proměnných a případů, praktické využití. (kap. 6, dodatek 2) 9. Vytváření nových proměnných. Tvorba součtových škál. Kontrola reliability a validity škál. Ukázky některých známých škál (Srole, anomie, LP). Načítání určitého typu odpovědí v baterii. Náhodné vybírání z datového souboru, metoda TTD. Výpočty kvantilů statistických rozdělení a matematické operace v SPSS a MS Excel. (dodatek 2, dodatek 3) 10. Chybějící hodnoty-důvody vzniku. Definice v SPSS a práce s chybějícími hodnotami. Analýza chybějících hodnot a jejich dopad na výsledky. Možnosti náhrad chybějících hodnot (speciální nabídky v regresi a faktorové analýze). Vážení data tvorb vah. (kap. 6) 11. Otevřené otázky a jejich zpracování. Četnosti otevřených otázek, kontingenční tabulka z otevřených otázek. 12. Náhodné a nenáhodné výběry a používání statistiky. Úplná zjišťování v ČR. Problematika malých výběrů, výběry z malých základních souborů. (článek Rabušic, Soukup)
V závorkách je uvedeno, kde v textu Mareš, Rabušic, Soukup (bez uvedeíní zdroje) či v jiných učebnicích či textech je téma pojednáno a dle toho bude vyžadováno u zkoušky
Cvičení slouží k praktickému nácviku probíraných analytických metod na datech v SPSS a Excelu.