Cílem kursu je rozšíření možností produktu SAS, a to jak v přípravě práce s daty, tak s jejich následnou (vícerozměrnou) analýzou, zejména při demografickém studiu.
Poslední úprava: Rychtaříková Jitka, prof. RNDr., CSc. (29.06.2021)
The course introduses students to the SAS software with lot of practical examples. In addition, selected procedures from SAS/STAT software are taught in order to use multidimensional statistics in demography.
Poslední úprava: Rychtaříková Jitka, prof. RNDr., CSc. (29.06.2021)
ŘEHÁKOVÁ, B. (2000): Nebojte se logistické regrese, Sociologický časopis, 36, 4. l Doporučená literatura:
Kleinbaum, D. G., KLEIN, M. (2011): Survival Analysis, A Self-Learning Text, Springer.
Kleinbaum, D. G., KLEIN, M. (2010): Logistic Regression, A Self-Learning Text, Springer.
Hendl, J. (2004): Přehled statistických metod zpracování dat. Praha: Portál.
Wonnacot, T. - Wonnacot, R. (1995): Statistika pro obchod a hospodářství. Praha: Victoria Publishing.
Poslední úprava: Janáková Kuprová Barbora, RNDr., Ph.D. (22.12.2019)
Požadavky ke zkoušce -
Forma zkoušky je písemná. Předpokladem je absolvování závěrečného písemného testu (sestavení programu)a aktivní účast na výuce.
Poslední úprava: Rychtaříková Jitka, prof. RNDr., CSc. (29.06.2021)
Examination: written. Precondition is the final written test (program preparation) and active participation in lessons are required.
Poslední úprava: Rychtaříková Jitka, prof. RNDr., CSc. (29.06.2021)
Sylabus -
1. The STDRATE procedure (SAS/STAT). Metody standardizace: přímá, nepřímá a Mantel-Haenszel. Výpočet Atributivní frakce a Populační atributivní frakce. Intervaly spolehlivosti a testování významnosti rozdílů. Míry a rizika.
2. PLOT procedure (SAS/GRAPH).Tvorba x,y a dalších grafů v grafickém režimu, Popis grafů os, volba typu čar, barev, ap. GPLOT procedure (dvourozměrné grafy, korelační diagramy, 1-2 osy y).GCHART procedure GBARLINE procedure(sloupcové grafy, četnosti, kumulativní četnosti, sloupcové a čárové grafy, ap.).
3. LIFETEST procedure (SAS/STAT). (Survival analysis – analýza přežití). Neparametrické odhady délky přežití. Kaplan-Meierova metoda a aktuárská (úmrtnostní) tabulka. Cenzorování. Funkce SDF, CDF a PDF. Volba délky intervalů času, testování odlišnosti křivek. Kreslení grafů tabulkových funkcí. Agregovaná a individuální data.
4. LIFEREG procedure (SAS/STAT).Parametrické odhady délky přežití. Metody odhadu parametrů. Exponenciální a Weibullovo rozdělení. Porovnání parametrického modelu s neparametrickým řešením. Agregovaná a individuální data.
5. PHREG procedure (SAS/STAT).Semiparametrické modelování. Coxova regrese. Odhady vlivu proměnných (numerické i nominální) na délku přežití. Transformace nominálních proměnných na designové proměnné (designová matice). Proporcionální rizika. Testování významnosti proměnných a jednotlivých kategorií mezi sebou. Metody výběru proměnných. Agregovaná a individuální data.
6. LOGISTIC procedure (SAS/STAT). Binární logistická regrese. Ordinální logistická regrese. Multinomická logistická regrese. Link funkce. Pravděpodobnost, šance, poměr šancí. Transformace nominálních proměnných na designové proměnné (designová matice). Testování významnosti proměnných a rozdílů mezi kategoriemi. Testování vhodnosti kumulativního logitového modelu. Metody výběru proměnných. Agregovaná a individuální data.
7. The GENMOD Procedure (SAS/STAT). Zobecněné lineární modely. Poissonova regrese. Model hlavních efektů a interakce. Míry a relativní rizika. Individuální a agregovaná data.
8. The QUANTLIFE Procedure (SAS/STAT). Kvantilová regrese (např. data obsahují extrémní pozorování) odhaduje podmíněné kvantily závislé proměnné v závislosti na hodnotách nezávislé proměnných. (Metoda nejmenších čtverců minimalizuje součet druhých mocnin reziduí, kvantilová regrese minimalizuje součet absolutních hodnot reziduí.). Numerické i nominální proměnné, cenzorování. Agregovaná a individuální data.
Poslední úprava: Rychtaříková Jitka, prof. RNDr., CSc. (29.06.2021)
1. The STDRATE procedure (SAS/STAT) computes directly standardized rates and risks, indirectly standardized rates and risks, and Mantel-Haenszel estimates, including their confidence limits. For two study populations with the same reference population, PROC STDRATE compares directly standardized rates or risks from these two populations.
2. SAS/GRAPH. The GPLOT procedure plots the values of two or more variables on a set of coordinate axes (X and Y). It creates line plots, scatters, histograms, area plots, bubble plots, high-low plots, needle plots, plots with simple or spline-interpolated lines. etc.). GCHART procedure produces six types of charts: block charts, horizontal and vertical bar charts, pie and donut charts, and star charts. GBARLINE procedure creates bar-line charts; vertical barcharts with one or more plot overlays.
3. The LIFETEST procedure (SAS/STAT) computes nonparametric estimates of the survivor functions, compares survival curves, and computes tests for association of the failure time variable with covariates. Censoring. Nonparametric estimates of the survivor function are computed either by the product-limit method (also called the Kaplan-Meier method) or by the life-table method (also called the actuarial method). The survival distribution function (SDF), the cumulative distribution function (CDF), the probability density function (PDF), and the hazard function, including standard errors, are estimated.
4. The LIFEREG procedure (SAS/STAT) fits parametric models to failure time data that can be uncensored, right censored, left censored, or interval censored. The exponential, Weibull, lognormal, and other distributions are supported. The models are equivalent to accelerated failure time models when the log of the response is the quantity being modeled. The effect of independent variables on an event time distribution is multiplicative. The estimates of parameters are made by maximum likelihood method.
5. The PHREG procedure (SAS/STAT) performs regression analysis of survival data based on the Cox proportional hazards model known as multiplicative hazard model. Cox's model is used in the analysis of survival data to explain the effect of explanatory variables (including time-dependent variables) on hazard rates. The Cox proportional hazards model (semi-parametric) makes the assumption that the hazards for subgroups are proportional to the baseline hazard. Cox model is fitted by maximizing the partial likelihood. The CLASS statement enables the classification variables to be used, in addition to continuous variables, as explanatory variables in the analysis.
6. The LOGISTIC procedure fits logistic models, in which the response can be binary or ordinal or nominal. Logistic regression analysis is used to investigate the relationship between these discrete responses and a set of explanatory variables that can be continuous or categorical. Link function is logit function. The model is fitted by the method of maximum likelihood. Odds ratios are displayed along with parameter estimates.
7. The GENMOD (SAS/STAT) procedure fits generalized linear models.The generalized linear models are an extension of traditional linear models that allows the mean of a population to depend on a linear predictor through a nonlinear link function and allows the response probability distribution to be any member of an exponential family of distributions. Poisson Regression for Count data and Poisson Regression for Rate data. Poisson regression is used for modeling count or rate data with the assumption that the conditional mean equal the conditional variance.
8. The QUANTLIFE Procedure(SAS/STAT). Quantile regression analysis is a type of regression analysis that explores how the conditional quantile of a response variable depends on its covariates. Quantile regression offers a powerful tool in survival analysis, where the lifetimes are skewed and extreme survival times can be of special interest. It accounts for censoring and provide valid estimates. The method is distribution-free and apply to heteroscedastic data.
Poslední úprava: Rychtaříková Jitka, prof. RNDr., CSc. (29.06.2021)