PředmětyPředměty(verze: 953)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Demografické aplikace SAS III - MD360P46R
Anglický název: SAS Aplication in Demography III
Český název: Demografické aplikace SAS III
Zajišťuje: Katedra demografie a geodemografie (31-360)
Fakulta: Přírodovědecká fakulta
Platnost: od 2017 do 2023
Semestr: zimní
E-Kredity: 3
Způsob provedení zkoušky: zimní s.:kombinovaná
Rozsah, examinace: zimní s.:1/1, Zk [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: čeština
Úroveň: specializační
Poznámka: povolen pro zápis po webu
Garant: prof. RNDr. Jitka Rychtaříková, CSc.
Vyučující: prof. RNDr. Jitka Rychtaříková, CSc.
Neslučitelnost : MD360P46
Je neslučitelnost pro: MD360P46
Anotace -
Předmět představuje studentům software SAS včetně praktických příkladů. Vyučovány jsou vybrané postupy ze softwaru SAS / STAT, vhodné k použití vícerozměrných statistik v demografii. SAS / STAT (BOXPLOT, ANOVA, FACTOR, STDIZE, CLUSTER, DISTANCE, TREE, VARCLUS).
Poslední úprava: Rychtaříková Jitka, prof. RNDr., CSc. (20.09.2020)
Literatura -

Povinná literatura:

Base SAS 9.4 Statistical Procedures

SAS/STAT 14.2 User's Guide.

Hendl, J. (2004): Přehled statistických metod zpracování dat. Praha: Portál.

 

Prezentace ve formátu pdf v případě prezenční výuky budou v adresáři:

v: \Rychtarikova\ rok_2020_2021\ Demograficke_Aplikace_SAS_III \

 

V případě distanční výuky budou prezentace formou komentované prezentace SAS kódu na: Google disk v adresáři: Rychtarikova_Vyuka_2020_2021\ Demograficke_Aplikace_SAS_III \

Odkaz bude poslán hromadným mailem přes SIS.

 

Poslední úprava: Rychtaříková Jitka, prof. RNDr., CSc. (20.09.2020)
Požadavky ke zkoušce -

Předpokladem je absolvování závěrečného písemného testu (sestavení kódu) a aktivní účast na výuce.

Poslední úprava: Rychtaříková Jitka, prof. RNDr., CSc. (29.06.2021)
Sylabus -

1)    The BOXPLOT Procedure (SAS/STAT). Krabicový graf s anténami (box-and-whisker plot), označovaný též boxplot znázorňuje medián, eventuálně průměr, kvartily, minimum a maximum v dané skupině, odlehlé a extrémní hodnoty. Délka krabičky se rovná kvartilovému rozpětí QR (rozdíl mezi hodnotou horního a dolního kvartilu), uvnitř je čára mediánu, horní anténa odpovídá maximu (resp. maximu v pásmu  Q3 +1,5QR) a dolní minimu (resp. minimu v pásmu Q1 – 1,5QR). BOXSTYLE=SKELETAL (antény znázorňují minimum a maximum). BOXSTYLE=SCHEMATIC (antény znázorňují maximum v pásmu Q3 +1,5QR a minimum v rámci Q1 – 1,5QR; BOXSTYLE=SCHEMATICID a BOXSTYLE=SCHEMATICIDFAR znázorňují odlehlé hodnoty, respektive extrémní hodnoty. Umístění souhrnných statistik do grafu INSET INSETGROUP.

 

2)    The UNIVARIATE Procedure (Base SAS). Statistiky založené na momentech (průměr, rozptyl, směrodatná odchylka, variační koeficient, šikmost, špičatost), kvantily, modus, odlehlé hodnoty, četnosti. Intervaly spolehlivosti pro průměr, směrodatnou odchylku a varianci. Příkazy FREQ a WEIGHT. Histogram (HISTOGRAM), proložení histogramu (parametrickými rozloženími, neparametrickým jádrovým - kernel). Umístění textu a souhrnných statistik do grafu (INSET). PROBPLOT and Q-Q diagram (QQPLOT). Skupinová data a tvorba skupinových (srovnávacích grafů), příkaz CLASS. Zaokrouhlování hodnot proměnných (ROUND). Testování statistik. The MEANS Procedure (Base SAS).

 

3)    The FREQ Procedure (Base SAS). Tvorba jednorozměrných a vícerozměrných tabulek četností. Testování závislostí v kontingenčních tabulkách. (TABLES  definuje typ tabulky; specificky tabulky 2x2 – poměr šancí a relativní riziko). TEST (Chi-kvadrát test, Pearsonův korelační koeficient, Spearmanův korelační koeficient pořadí). Příkaz WEIGHT.

 

4)    The CORR Procedure (Base SAS). Pearsonův korelační koeficient (parametrická míra asociace dvou proměnných). Měří sílu a směr lineární asociace. Spearmanův koeficient pořadové korelace (neparametrická míra asociace založená na pořadí), Kendallův koeficient pořadové korelace (Kendallovo tau, míra založená na počtu konkordancí a diskordancí párových pozorování). Pearsonův, Spearmanův, Kendallův koeficient parciální korelace (PARTIAL statement). Příkazy FREQ a WEIGHT.

 

5)      ODS Graphics (Base SAS). Tvorba „statistických“ grafů s pokročilými možnostmi fomátování, barev ap.  The SGPLOT Procedure umožňuje tvorbu velkého množství různých druhů grafů: korelační diagramy, histogramy, liniové grafy, sloupcové grafy, výstupy z regrese a další. The SGSCATTER Procedure umožňuje pokročilou tvorbu různě uspořádaných korelačních diagramů. The SGPANEL Procedure umožňuje skupinové uspořádání grafů, které také mohou být rozdílně formátovány.

 

6)    Transformace dat, (statistická) standardizace: Standard, Stdize.

·        The STANDARD Procedure (Base SAS). Standardizace vzhledem k danému průměru a dané směrodatné odchylce, vytváří se nový datový soubor, který obsahuje standardizované proměnné (standardizovaná data nebo-li standardizované skóry).

·        The STDIZE Procedure (SAS/STAT). Standardizace vzhledem k dané konstantě a měřítku.  Více možností oproti proc standard.

 

7)    The ANOVA Procedure (SAS/STAT). Analýza variance pro vyvážená data. Efekt jednoho faktoru na závisle proměnnou. Hlavní a interakční efekty kategoriálních nezávislých proměnných na závisle proměnnou kvantitativního typu. F-testovací charakteristika rozdílnosti skupinových průměrů. Procedure GLM pro vyvážená a nevyvážená data.

 

8)    MAKRA. Typy a použití. Makro proměnná, přiřazení hodnot a použití. Makro jako část programu definovaná uživatelem pro opakované použití. Makra v knihovně programů SAS a jejich aplikace.

 

9)    The FACTOR Procedure (SAS/STAT). Cílem je popis chování množiny proměnných pomocí menšího počtu nových proměnných – faktorů.  Metoda hlavních komponent, faktorové zátěže, faktorová rotace, faktorové skóry. Příkazy FREQ a WEIGHT.

 

10) The DISTANCE Procedure(SAS/STAT). Výpočet matice vzdáleností mezi objekty pro různé typy proměnných.

 

11) The CLUSTER Procedure (SAS/STAT). Cílem shlukové analýzy je rozdělit objekty do skupin na základě jejich podobnosti. Transformace proměnných. Omezený výpočet matice vzdáleností.

 

12) The TREE Procedure (SAS/STAT). Tvorba dendrogramu, horizontálně, vertikálně a další formátování.

 

13) The VARCLUS Procedure (SAS/STAT). Seskupování proměnných. Metoda redukce proměnných.

 

 

Poslední úprava: Rychtaříková Jitka, prof. RNDr., CSc. (29.06.2021)
 
Univerzita Karlova | Informační systém UK