Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Ambos lados da revisão anteriorRevisão anterior
Próxima revisão
Revisão anterior
disciplinas:ce225-2012-02:historico [2013/02/14 17:51] paulojusdisciplinas:ce225-2012-02:historico [2013/03/04 08:09] (atual) – [22/02] paulojus
Linha 25: Linha 25:
 | 23/01 | PA-03 |Modelagem estatística: de LM's a GLM' |    |  | | | |   | 23/01 | PA-03 |Modelagem estatística: de LM's a GLM' |    |  | | | |  
 | 25/01 | PA-03 |Comparando modelos e estratégias de modelagem em determinados problemas - em quais aspectos os modelos são diferentes? Modelos lineares, linearizáveis, não lineares, normais e não normais. Avaliação e comparação de ajustes de modelos.  |    |  | | | |   | 25/01 | PA-03 |Comparando modelos e estratégias de modelagem em determinados problemas - em quais aspectos os modelos são diferentes? Modelos lineares, linearizáveis, não lineares, normais e não normais. Avaliação e comparação de ajustes de modelos.  |    |  | | | |  
-| 30/01 | LABEST (VER ABAIXO) |Exemplos de problemas sob a forma de GLM' |    |  | | | |   +| 30/01 | LABEST |Exemplos de problemas sob a forma de GLM's  (VER ABAIXO) |    |  | | | |   
-| 01/02 | LABEST (VER ABAIXO) |Interpretações de resultados das análises      |  | | | |   +| 01/02 | LABEST  |Interpretações de resultados das análises (VER ABAIXO)   |    |  | | | |   
-| 06/02 | PA-03 (VER ABAIXO)|Testes de hipótese em GLM e tipos de resíduos, com ênfase em de Pearson e de Deviance  |    |  | | | |   +| 06/02 | PA-03 |Testes de hipótese em GLM e tipos de resíduos, com ênfase em de Pearson e de Deviance  (VER ABAIXO)|    |  | | | |   
-08/02 | LABEST (VER ABAIXO) |  |    |  | | | |  +15/02 | LABEST | Análise de tabelas de contingência. Distribuições e modelos alternativos e equivalências em análise  via GLM|  |    |  | | | |   
 +| 20/02 |atividades de estudo |(ver abaixo   |  |  | | | |   
 +| 22/02 |atividades de estudo |(ver abaixo)  |    |  | | | |   
 +| 27/02 |PA-03 | Outros GLM's - estendendo GLM usuais - modelos com dispersão, modelagem de média e variância, quasi verosimilhança, superdispersão e efeitos aleatórios  |    |  | | | |   
 +| 01/03 | LABEST |exemplos de "outros" GLM's. Ex: Escolha da modelo, modelo binomial negativo e quasipoisson (ver abaixo) |    |  | | | |  
  
  
Linha 228: Linha 232:
 ------------------------------ ------------------------------
 </code> </code>
 +
 +<code R>
 +
 +M <- cbind(c(435, 375), c(147, 134))
 +dimnames(M) <- list(c("F", "M"), c("S", "N"))
 +M
 +
 +chisq.test(M)
 +
 +addmargins(M)
 +Mesp <- outer(rowSums(M), colSums(M))/sum(M)
 +Mesp
 +
 +(Chi2 <- sum(((M - Mesp)^2)/Mesp))
 +chisq.test(M, correct=F)
 +
 +
 +vam <- data.frame(Y=as.vector(M), Sexo = rownames(M), Acredita=rep(colnames(M), each=2))
 +vam
 +
 +## Modelo 0
 +
 +## Modelo 1: (independência)
 +## E(Y) = mu = n * Sexo * Acredita 
 +## log(mu)  = log(n) + log(Sexo) + log(Acredita) 
 +mod1 <- glm(Y ~ Sexo + Acredita, family=poisson(link="log"), data=vam)
 +model.matrix(mod1)
 +mod1
 +
 +fitted(mod1)
 +Mesp
 +
 +resid(mod1, type="pearson")
 +(M - Mesp)/sqrt(Mesp)
 +
 +sum(resid(mod1, type="pearson")^2)
 +
 +
 +resid(mod1, type="deviance")
 +sum(resid(mod1, type="deviance")^2)
 +
 +
 +## Modelo 2: não independência
 +mod2 <- glm(Y ~ Sexo * Acredita, family=poisson, data=vam)
 +model.matrix(mod2)
 +mod2
 +
 +fitted(mod2)
 +M
 +
 +anova(mod1, mod2, test="Chisq")
 +
 +## extensível a várias dimensões - modelos log-lineares
 +
 +# sob link canônico X'y = X'\hat{mu}
 +#  - marginais preditas iguais a observadas em mod1
 +</code>
 +
  
 **Exemplo 2**\\ **Exemplo 2**\\
Linha 250: Linha 312:
 Ajuste o modelo fazendo suposições necessárias e adequadas.\\ Ajuste o modelo fazendo suposições necessárias e adequadas.\\
 Procure avaliar a qualidade de ajuste e possíveis formas de tentar melhorar o ajuste com os dados disponíveis.\\ Procure avaliar a qualidade de ajuste e possíveis formas de tentar melhorar o ajuste com os dados disponíveis.\\
-Represente o(s) modelo(s) ajustados graficamente (na escala das observações) procurando incluir no gráfico a incerteza das previsões. +Represente o(s) modelo(s) ajustados graficamente (na escala das observações) procurando incluir no gráfico a incerteza das previsões 
-  + 
 +<code R> 
 +# mu_i = a exp(b*ano_i) 
 +# log(mu_i) = log(a) +  b*ano_i  = \beta_0 +  \beta_1 * ano_i 
 + 
 +m1 <- glm(y ~ ano, family=poisson, data=aids)  
 +m1 
 +summary(m1) 
 + 
 +plot(resid(m1) ~fitted(m1)) 
 +lines(lowess(resid(m1) ~fitted(m1))) 
 + 
 +par(mfrow=c(2,2)) 
 +plot(m1) 
 +par(mfrow=c(1,1)) 
 + 
 +## tentando melhorar o ajuste 
 +m2 <- glm(y ~ ano + I(ano^2), family=poisson, data=aids)  
 +m2 
 +summary(m2) 
 +anova(m1,m2, test="Chisq"
 + 
 +# nao faz sentido aqui mas é util com variaveis diferentes  
 +drop1(m2) 
 +drop1(m2, test="Chisq"
 + 
 +ano.seq <- seq(1,13, l=100) 
 +ypred <- predict(m2, data.frame(ano=ano.seq), se=TRUE) 
 +str(ypred) 
 +with(aids, plot(y ~ I(1980 + ano), ylim=c(0,280))) 
 +lines(exp(ypred$fit) ~ I(ano.seq+1980)) 
 +lines(exp(ypred$fit - 2*ypred$se.fit) ~ I(ano.seq+1980), lty=2) 
 +lines(exp(ypred$fit + 2*ypred$se.fit) ~ I(ano.seq+1980), lty=2) 
 +</code> 
 + 
 +=== 20/02 === 
 +   - Obter as funções de verossimilhança para os quatro modelos discutidos em aula para tabelas de contingência 
 +   - proceder as análises com cada um dos modelos usando algum ambiente computacional 
 +   - Examinar e justificar a razão pela qual podem ser ajustados com GLM com família Poisson 
 +   - Comparar e discutir semelhanças e diferenças entre o ajuste de GLM com outros procedimentos (teste exato de fisher, teste chi-quadrado)   
 + 
 +=== 22/02 === 
 +  - Mostrar como quantidades de interesse (predição) podem ser obtidas. Utilizar os exemplos vistos em aula.  
 +    - Mostrar como obter as predições na escala da resposta e da função de ligação 
 +    - Mostrar como obter os intervalos de predição 
 +    - Verificar os resultados com os retornados pela função ''predict()'' do R 
 +    - Algumas sugestões: 
 +      - como calcular os valores da curva de valores ajustados nos exemplos da //creatinina vs infarto// e no de "novos casos de AIDS na Bélgica". Ainda neste exemplo, como estimar a dose associada a uma certa probabilidade fixada de morte? 
 +      - como calcular as contagens esperadas no exemplo de //crença vc sexo// ? 
 + 
 + 
 +=== 01/03 === 
 +Comandos do exemplo discutido em aula 
 +<code R> 
 +## carregando o conjunto de dados DHF99 do pacote epicalc 
 +require(epicalc) 
 +data(DHF99) 
 +head(DHF99) 
 +help(DHF99) 
 +summary(DHF99) 
 +summary(DHF99) 
 +## a variável village está como numérica mas de fato é um fator 
 +DHF99$village <- as.factor(DHF99$village) 
 +summary(DHF99) 
 +## 
 +## Ajustando GLM'
 +glm1 <- glm(containers ~ village + education, data=DHF99, family=poisson) 
 +glm1 
 +summary(glm1) 
 +anova(glm1) 
 +## 
 +## vamos usar agora apenas a informação do tipo de vila 
 +glm2 <- glm(containers ~ viltype + education, data=DHF99, family=poisson) 
 +glm2 
 +summary(glm1) 
 +anova(glm1) 
 +## 
 +## comparando os ajustes 
 +anova(glm2, glm1, test="Chisq"
 +## Portanto a informação individual de cada vila é relevante. 
 +## Entretanto, como exemplo vamos supor que não dispomos da informação individual 
 +## e apenas o tipo de vila. 
 +## Neste caso o ajuste não é bom e vamos tentar alternativas 
 +## 1. Modelo com interação 
 +glm3 <- glm(containers ~ viltype * education, data=DHF99, family=poisson) 
 +anova(glm2, glm3, test="Chisq"
 +anova(glm2, glm3, test="F"
 +## 2. Modelo Binomial negativo 
 +require(MASS) 
 +glm2BN <- glm.nb(containers ~ viltype + education, data=DHF99) 
 +glm2BN 
 +c(poisson=logLik(glm2), BN=logLik(glm2BN)) 
 +c(poisson=deviance(glm2), BN=deviance(glm2BN)) 
 +c(poisson=AIC(glm2), BN=AIC(glm2BN)) 
 +## comparando os coeficientes e erros padrão 
 +summary(glm2) 
 +summary(glm2BN) 
 +## 3. Modelo quasipoisson 
 +glm2Q <- 
 + glm(containers ~ viltype + education, data=DHF99, family=quasipoisson) 
 +## comparando os coeficientes e erros padrão 
 +summary(glm2) 
 +summary(glm2Q) 
 +## Note que os ajustes poderiam ser avaliados em mais detalhes 
 +par(mfrow=c(2,2)) 
 +plot(glm1) 
 +plot(glm2) 
 +plot(glm3) 
 +plot(glm2BN) 
 +## 
 +## As análises poderiam prosseguir de diversas formas. Alguns exemplos: 
 +## - avaliando ainda outros modelos como por exemplo inflacionados de de zeros, hurdle . 
 +## - verificando a relevância das covariáveis (e.g education) 
 +## - Caso as vilas fossem consideradas poderia-se avaliar modelos mistos como vilas como efeito aleatórios 
 +</code> 

QR Code
QR Code disciplinas:ce225-2012-02:historico (generated for current page)