Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Ambos lados da revisão anteriorRevisão anterior
Próxima revisão
Revisão anterior
disciplinas:ce225-2012-02:historico [2013/02/07 17:16] paulojusdisciplinas:ce225-2012-02:historico [2013/03/04 08:09] (atual) – [22/02] paulojus
Linha 25: Linha 25:
 | 23/01 | PA-03 |Modelagem estatística: de LM's a GLM' |    |  | | | |   | 23/01 | PA-03 |Modelagem estatística: de LM's a GLM' |    |  | | | |  
 | 25/01 | PA-03 |Comparando modelos e estratégias de modelagem em determinados problemas - em quais aspectos os modelos são diferentes? Modelos lineares, linearizáveis, não lineares, normais e não normais. Avaliação e comparação de ajustes de modelos.  |    |  | | | |   | 25/01 | PA-03 |Comparando modelos e estratégias de modelagem em determinados problemas - em quais aspectos os modelos são diferentes? Modelos lineares, linearizáveis, não lineares, normais e não normais. Avaliação e comparação de ajustes de modelos.  |    |  | | | |  
-| 30/01 | LABEST (VER ABAIXO) |Exemplos de problemas sob a forma de GLM' |    |  | | | |   +| 30/01 | LABEST |Exemplos de problemas sob a forma de GLM's  (VER ABAIXO) |    |  | | | |   
-| 01/02 | LABEST (VER ABAIXO) |Interpretações de resultados das análises      |  | | | |   +| 01/02 | LABEST  |Interpretações de resultados das análises (VER ABAIXO)   |    |  | | | |   
-| 06/02 | PA-03 (VER ABAIXO)|Testes de hipótese em GLM e tipos de resíduos, com ênfase em de Pearson e de Deviance  |    |  | | | |   +| 06/02 | PA-03 |Testes de hipótese em GLM e tipos de resíduos, com ênfase em de Pearson e de Deviance  (VER ABAIXO)|    |  | | | |   
-08/02 | LABEST (VER ABAIXO) |  |    |  | | | |  +15/02 | LABEST | Análise de tabelas de contingência. Distribuições e modelos alternativos e equivalências em análise  via GLM|  |    |  | | | |   
 +| 20/02 |atividades de estudo |(ver abaixo   |  |  | | | |   
 +| 22/02 |atividades de estudo |(ver abaixo)  |    |  | | | |   
 +| 27/02 |PA-03 | Outros GLM's - estendendo GLM usuais - modelos com dispersão, modelagem de média e variância, quasi verosimilhança, superdispersão e efeitos aleatórios  |    |  | | | |   
 +| 01/03 | LABEST |exemplos de "outros" GLM's. Ex: Escolha da modelo, modelo binomial negativo e quasipoisson (ver abaixo) |    |  | | | |  
  
  
Linha 213: Linha 217:
  
 ==== 06/02 e 08/02 ==== ==== 06/02 e 08/02 ====
 +**Exemplo 1** \\
 A tabela abaixo apresenta dados de um estudo sobre "Acreditar em Vida Após a Morte" retirados de Wood (2006). A tabela abaixo apresenta dados de um estudo sobre "Acreditar em Vida Após a Morte" retirados de Wood (2006).
 O interesse aqui é utilizar estes dados para investigar se a crença está associada com o sexo. O interesse aqui é utilizar estes dados para investigar se a crença está associada com o sexo.
Linha 227: Linha 231:
 M         375      134 M         375      134
 ------------------------------ ------------------------------
 +</code>
 +
 +<code R>
 +
 +M <- cbind(c(435, 375), c(147, 134))
 +dimnames(M) <- list(c("F", "M"), c("S", "N"))
 +M
 +
 +chisq.test(M)
 +
 +addmargins(M)
 +Mesp <- outer(rowSums(M), colSums(M))/sum(M)
 +Mesp
 +
 +(Chi2 <- sum(((M - Mesp)^2)/Mesp))
 +chisq.test(M, correct=F)
 +
 +
 +vam <- data.frame(Y=as.vector(M), Sexo = rownames(M), Acredita=rep(colnames(M), each=2))
 +vam
 +
 +## Modelo 0
 +
 +## Modelo 1: (independência)
 +## E(Y) = mu = n * Sexo * Acredita 
 +## log(mu)  = log(n) + log(Sexo) + log(Acredita) 
 +mod1 <- glm(Y ~ Sexo + Acredita, family=poisson(link="log"), data=vam)
 +model.matrix(mod1)
 +mod1
 +
 +fitted(mod1)
 +Mesp
 +
 +resid(mod1, type="pearson")
 +(M - Mesp)/sqrt(Mesp)
 +
 +sum(resid(mod1, type="pearson")^2)
 +
 +
 +resid(mod1, type="deviance")
 +sum(resid(mod1, type="deviance")^2)
 +
 +
 +## Modelo 2: não independência
 +mod2 <- glm(Y ~ Sexo * Acredita, family=poisson, data=vam)
 +model.matrix(mod2)
 +mod2
 +
 +fitted(mod2)
 +M
 +
 +anova(mod1, mod2, test="Chisq")
 +
 +## extensível a várias dimensões - modelos log-lineares
 +
 +# sob link canônico X'y = X'\hat{mu}
 +#  - marginais preditas iguais a observadas em mod1
 +</code>
 +
 +
 +**Exemplo 2**\\
 +Novos casos de AIDS na Bélgica de 1981 a 1993.\\
 +Modelo Epidêmico (Venables & Ripley, MASS). \\
 +//Interesse:// A taxa de novos casos está reduzindo?
 +
 +<code R>
 +aids <- data.frame(
 +        y = c(12,14,33,50,67,74,123,141,165,204,253,246,240),
 +        ano = 1:13
 +)
 +aids
 +with(aids, plot(y ~ I(1980 + ano)))
 +</code>
 +
 +Considere um modelo em que o número esperado de novos casos por ano seja:
 +<latex>
 +\mu_i = \gamma \exp(\delta t_i)
 +</latex>
 +
 +Ajuste o modelo fazendo suposições necessárias e adequadas.\\
 +Procure avaliar a qualidade de ajuste e possíveis formas de tentar melhorar o ajuste com os dados disponíveis.\\
 +Represente o(s) modelo(s) ajustados graficamente (na escala das observações) procurando incluir no gráfico a incerteza das previsões
 +
 +<code R>
 +# mu_i = a . exp(b*ano_i)
 +# log(mu_i) = log(a) +  b*ano_i  = \beta_0 +  \beta_1 * ano_i
 +
 +m1 <- glm(y ~ ano, family=poisson, data=aids) 
 +m1
 +summary(m1)
 +
 +plot(resid(m1) ~fitted(m1))
 +lines(lowess(resid(m1) ~fitted(m1)))
 +
 +par(mfrow=c(2,2))
 +plot(m1)
 +par(mfrow=c(1,1))
 +
 +## tentando melhorar o ajuste
 +m2 <- glm(y ~ ano + I(ano^2), family=poisson, data=aids) 
 +m2
 +summary(m2)
 +anova(m1,m2, test="Chisq")
 +
 +# nao faz sentido aqui mas é util com variaveis diferentes 
 +drop1(m2)
 +drop1(m2, test="Chisq")
 +
 +ano.seq <- seq(1,13, l=100)
 +ypred <- predict(m2, data.frame(ano=ano.seq), se=TRUE)
 +str(ypred)
 +with(aids, plot(y ~ I(1980 + ano), ylim=c(0,280)))
 +lines(exp(ypred$fit) ~ I(ano.seq+1980))
 +lines(exp(ypred$fit - 2*ypred$se.fit) ~ I(ano.seq+1980), lty=2)
 +lines(exp(ypred$fit + 2*ypred$se.fit) ~ I(ano.seq+1980), lty=2)
 +</code>
 +
 +=== 20/02 ===
 +   - Obter as funções de verossimilhança para os quatro modelos discutidos em aula para tabelas de contingência
 +   - proceder as análises com cada um dos modelos usando algum ambiente computacional
 +   - Examinar e justificar a razão pela qual podem ser ajustados com GLM com família Poisson
 +   - Comparar e discutir semelhanças e diferenças entre o ajuste de GLM com outros procedimentos (teste exato de fisher, teste chi-quadrado)  
 +
 +=== 22/02 ===
 +  - Mostrar como quantidades de interesse (predição) podem ser obtidas. Utilizar os exemplos vistos em aula. 
 +    - Mostrar como obter as predições na escala da resposta e da função de ligação
 +    - Mostrar como obter os intervalos de predição
 +    - Verificar os resultados com os retornados pela função ''predict()'' do R
 +    - Algumas sugestões:
 +      - como calcular os valores da curva de valores ajustados nos exemplos da //creatinina vs infarto// e no de "novos casos de AIDS na Bélgica". Ainda neste exemplo, como estimar a dose associada a uma certa probabilidade fixada de morte?
 +      - como calcular as contagens esperadas no exemplo de //crença vc sexo// ?
 +
 +
 +=== 01/03 ===
 +Comandos do exemplo discutido em aula
 +<code R>
 +## carregando o conjunto de dados DHF99 do pacote epicalc
 +require(epicalc)
 +data(DHF99)
 +head(DHF99)
 +help(DHF99)
 +summary(DHF99)
 +summary(DHF99)
 +## a variável village está como numérica mas de fato é um fator
 +DHF99$village <- as.factor(DHF99$village)
 +summary(DHF99)
 +##
 +## Ajustando GLM's
 +glm1 <- glm(containers ~ village + education, data=DHF99, family=poisson)
 +glm1
 +summary(glm1)
 +anova(glm1)
 +##
 +## vamos usar agora apenas a informação do tipo de vila
 +glm2 <- glm(containers ~ viltype + education, data=DHF99, family=poisson)
 +glm2
 +summary(glm1)
 +anova(glm1)
 +##
 +## comparando os ajustes
 +anova(glm2, glm1, test="Chisq")
 +## Portanto a informação individual de cada vila é relevante.
 +## Entretanto, como exemplo vamos supor que não dispomos da informação individual
 +## e apenas o tipo de vila.
 +## Neste caso o ajuste não é bom e vamos tentar alternativas
 +## 1. Modelo com interação
 +glm3 <- glm(containers ~ viltype * education, data=DHF99, family=poisson)
 +anova(glm2, glm3, test="Chisq")
 +anova(glm2, glm3, test="F")
 +## 2. Modelo Binomial negativo
 +require(MASS)
 +glm2BN <- glm.nb(containers ~ viltype + education, data=DHF99)
 +glm2BN
 +c(poisson=logLik(glm2), BN=logLik(glm2BN))
 +c(poisson=deviance(glm2), BN=deviance(glm2BN))
 +c(poisson=AIC(glm2), BN=AIC(glm2BN))
 +## comparando os coeficientes e erros padrão
 +summary(glm2)
 +summary(glm2BN)
 +## 3. Modelo quasipoisson
 +glm2Q <-
 + glm(containers ~ viltype + education, data=DHF99, family=quasipoisson)
 +## comparando os coeficientes e erros padrão
 +summary(glm2)
 +summary(glm2Q)
 +## Note que os ajustes poderiam ser avaliados em mais detalhes
 +par(mfrow=c(2,2))
 +plot(glm1)
 +plot(glm2)
 +plot(glm3)
 +plot(glm2BN)
 +##
 +## As análises poderiam prosseguir de diversas formas. Alguns exemplos:
 +## - avaliando ainda outros modelos como por exemplo inflacionados de de zeros, hurdle .
 +## - verificando a relevância das covariáveis (e.g education)
 +## - Caso as vilas fossem consideradas poderia-se avaliar modelos mistos como vilas como efeito aleatórios
 </code> </code>
  

QR Code
QR Code disciplinas:ce225-2012-02:historico (generated for current page)