Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Ambos lados da revisão anteriorRevisão anterior
Próxima revisão
Revisão anterior
disciplinas:ce225-2012-02:historico [2013/02/07 15:53] paulojusdisciplinas:ce225-2012-02:historico [2013/03/04 08:09] (atual) – [22/02] paulojus
Linha 24: Linha 24:
 | 14/12 | LABEST | Estimação: Algoritmo IWLS - exemplos (**[[http://leg.ufpr.br/~elias/ensino/ce225/bernoulli2.R|script]]**)|    |  | | | |   | 14/12 | LABEST | Estimação: Algoritmo IWLS - exemplos (**[[http://leg.ufpr.br/~elias/ensino/ce225/bernoulli2.R|script]]**)|    |  | | | |  
 | 23/01 | PA-03 |Modelagem estatística: de LM's a GLM' |    |  | | | |   | 23/01 | PA-03 |Modelagem estatística: de LM's a GLM' |    |  | | | |  
-| 25/01 | PA-03 |Comparando modelos e estratégias de modelagem em determinados problemas - em quais aspectos os modelos são diferentes? Avaliação e comparação de ajustes de modelos.  |    |  | | | |   +| 25/01 | PA-03 |Comparando modelos e estratégias de modelagem em determinados problemas - em quais aspectos os modelos são diferentes? Modelos lineares, linearizáveis, não lineares, normais e não normais. Avaliação e comparação de ajustes de modelos.  |    |  | | | |   
-| 30/01 | LABEST (VER ABAIXO) |Exemplos de problemas sob a forma de GLM' |    |  | | | |   +| 30/01 | LABEST |Exemplos de problemas sob a forma de GLM's  (VER ABAIXO) |    |  | | | |   
-| 01/02 | LABEST (VER ABAIXO) |Interpretações de resultados das análises      |  | | | |   +| 01/02 | LABEST  |Interpretações de resultados das análises (VER ABAIXO)   |    |  | | | |   
-| 06/02 | PA-03 (VER ABAIXO)|Testes de hipótese em GLM e tipos de resíduos, com ênfase em de Pearson e de Deviance  |    |  | | | |   +| 06/02 | PA-03 |Testes de hipótese em GLM e tipos de resíduos, com ênfase em de Pearson e de Deviance  (VER ABAIXO)|    |  | | | |   
-08/02 | LABEST (VER ABAIXO) |  |    |  | | | |  +15/02 | LABEST | Análise de tabelas de contingência. Distribuições e modelos alternativos e equivalências em análise  via GLM|  |    |  | | | |   
 +| 20/02 |atividades de estudo |(ver abaixo   |  |  | | | |   
 +| 22/02 |atividades de estudo |(ver abaixo)  |    |  | | | |   
 +| 27/02 |PA-03 | Outros GLM's - estendendo GLM usuais - modelos com dispersão, modelagem de média e variância, quasi verosimilhança, superdispersão e efeitos aleatórios  |    |  | | | |   
 +| 01/03 | LABEST |exemplos de "outros" GLM's. Ex: Escolha da modelo, modelo binomial negativo e quasipoisson (ver abaixo) |    |  | | | |  
  
  
Linha 213: Linha 217:
  
 ==== 06/02 e 08/02 ==== ==== 06/02 e 08/02 ====
 +**Exemplo 1** \\
 A tabela abaixo apresenta dados de um estudo sobre "Acreditar em Vida Após a Morte" retirados de Wood (2006). A tabela abaixo apresenta dados de um estudo sobre "Acreditar em Vida Após a Morte" retirados de Wood (2006).
 O interesse aqui é utilizar estes dados para investigar se a crença está associada com o sexo. O interesse aqui é utilizar estes dados para investigar se a crença está associada com o sexo.
Linha 220: Linha 224:
 interpretando as quantidades de interesse nas análises e ainda comparando com resultados de outro(s) procedimento(s). interpretando as quantidades de interesse nas análises e ainda comparando com resultados de outro(s) procedimento(s).
 <code> <code>
-#             Acredita +             Acredita 
-       ------------------- +        ------------------- 
-#Sexo      Sim        Não +Sexo      Sim        Não 
-#------------------------------ +------------------------------ 
-#F         435       147 +F         435      147 
-#M         375       134 +M         375      134 
-#------------------------------+------------------------------ 
 +</code> 
 + 
 +<code R> 
 + 
 +M <- cbind(c(435, 375), c(147, 134)) 
 +dimnames(M) <- list(c("F", "M"), c("S", "N")) 
 +
 + 
 +chisq.test(M) 
 + 
 +addmargins(M) 
 +Mesp <- outer(rowSums(M), colSums(M))/sum(M) 
 +Mesp 
 + 
 +(Chi2 <- sum(((M - Mesp)^2)/Mesp)) 
 +chisq.test(M, correct=F) 
 + 
 + 
 +vam <- data.frame(Y=as.vector(M), Sexo = rownames(M), Acredita=rep(colnames(M), each=2)) 
 +vam 
 + 
 +## Modelo 0 
 + 
 +## Modelo 1: (independência) 
 +## E(Y) = mu = n * Sexo * Acredita  
 +## log(mu)  = log(n) + log(Sexo) + log(Acredita)  
 +mod1 <glm(Y ~ Sexo + Acredita, family=poisson(link="log"), data=vam) 
 +model.matrix(mod1) 
 +mod1 
 + 
 +fitted(mod1) 
 +Mesp 
 + 
 +resid(mod1, type="pearson"
 +(M Mesp)/sqrt(Mesp) 
 + 
 +sum(resid(mod1, type="pearson")^2) 
 + 
 + 
 +resid(mod1, type="deviance"
 +sum(resid(mod1, type="deviance")^2) 
 + 
 + 
 +## Modelo 2: não independência 
 +mod2 <glm(Y ~ Sexo * Acredita, family=poisson, data=vam) 
 +model.matrix(mod2) 
 +mod2 
 + 
 +fitted(mod2) 
 +
 + 
 +anova(mod1, mod2, test="Chisq"
 + 
 +## extensível a várias dimensões modelos log-lineares 
 + 
 +# sob link canônico X'y = X'\hat{mu} 
 +#  marginais preditas iguais a observadas em mod1 
 +</code> 
 + 
 + 
 +**Exemplo 2**\\ 
 +Novos casos de AIDS na Bélgica de 1981 a 1993.\\ 
 +Modelo Epidêmico (Venables & Ripley, MASS). \\ 
 +//Interesse:// A taxa de novos casos está reduzindo? 
 + 
 +<code R> 
 +aids <data.frame( 
 +        y = c(12,14,33,50,67,74,123,141,165,204,253,246,240), 
 +        ano = 1:13 
 +
 +aids 
 +with(aids, plot(y ~ I(1980 + ano))) 
 +</code> 
 + 
 +Considere um modelo em que o número esperado de novos casos por ano seja: 
 +<latex> 
 +\mu_i = \gamma \exp(\delta t_i) 
 +</latex> 
 + 
 +Ajuste o modelo fazendo suposições necessárias e adequadas.\\ 
 +Procure avaliar a qualidade de ajuste e possíveis formas de tentar melhorar o ajuste com os dados disponíveis.\\ 
 +Represente o(s) modelo(s) ajustados graficamente (na escala das observações) procurando incluir no gráfico a incerteza das previsões 
 + 
 +<code R> 
 +# mu_i = a . exp(b*ano_i) 
 +# log(mu_i) = log(a) +  b*ano_i  = \beta_0 +  \beta_1 * ano_i 
 + 
 +m1 <glm(y ~ ano, family=poisson, data=aids)  
 +m1 
 +summary(m1) 
 + 
 +plot(resid(m1) ~fitted(m1)) 
 +lines(lowess(resid(m1) ~fitted(m1))) 
 + 
 +par(mfrow=c(2,2)) 
 +plot(m1) 
 +par(mfrow=c(1,1)) 
 + 
 +## tentando melhorar o ajuste 
 +m2 <glm(y ~ ano + I(ano^2), family=poisson, data=aids)  
 +m2 
 +summary(m2) 
 +anova(m1,m2, test="Chisq"
 + 
 +# nao faz sentido aqui mas é util com variaveis diferentes  
 +drop1(m2) 
 +drop1(m2, test="Chisq"
 + 
 +ano.seq <seq(1,13, l=100) 
 +ypred <predict(m2, data.frame(ano=ano.seq), se=TRUE) 
 +str(ypred) 
 +with(aids, plot(y ~ I(1980 + ano), ylim=c(0,280))) 
 +lines(exp(ypred$fit) ~ I(ano.seq+1980)) 
 +lines(exp(ypred$fit 2*ypred$se.fit) ~ I(ano.seq+1980), lty=2) 
 +lines(exp(ypred$fit + 2*ypred$se.fit) ~ I(ano.seq+1980), lty=2) 
 +</code> 
 + 
 +=== 20/02 === 
 +   Obter as funções de verossimilhança para os quatro modelos discutidos em aula para tabelas de contingência 
 +   proceder as análises com cada um dos modelos usando algum ambiente computacional 
 +   Examinar e justificar a razão pela qual podem ser ajustados com GLM com família Poisson 
 +   Comparar e discutir semelhanças e diferenças entre o ajuste de GLM com outros procedimentos (teste exato de fisher, teste chi-quadrado)   
 + 
 +=== 22/02 === 
 +  Mostrar como quantidades de interesse (predição) podem ser obtidas. Utilizar os exemplos vistos em aula.  
 +    Mostrar como obter as predições na escala da resposta e da função de ligação 
 +    Mostrar como obter os intervalos de predição 
 +    Verificar os resultados com os retornados pela função ''predict()'' do R 
 +    Algumas sugestões: 
 +      como calcular os valores da curva de valores ajustados nos exemplos da //creatinina vs infarto// e no de "novos casos de AIDS na Bélgica". Ainda neste exemplo, como estimar a dose associada a uma certa probabilidade fixada de morte? 
 +      como calcular as contagens esperadas no exemplo de //crença vc sexo// ? 
 + 
 + 
 +=== 01/03 === 
 +Comandos do exemplo discutido em aula 
 +<code R> 
 +## carregando o conjunto de dados DHF99 do pacote epicalc 
 +require(epicalc) 
 +data(DHF99) 
 +head(DHF99) 
 +help(DHF99) 
 +summary(DHF99) 
 +summary(DHF99) 
 +## a variável village está como numérica mas de fato é um fator 
 +DHF99$village <as.factor(DHF99$village) 
 +summary(DHF99) 
 +## 
 +## Ajustando GLM'
 +glm1 <glm(containers ~ village + education, data=DHF99, family=poisson) 
 +glm1 
 +summary(glm1) 
 +anova(glm1) 
 +## 
 +## vamos usar agora apenas a informação do tipo de vila 
 +glm2 <glm(containers ~ viltype + education, data=DHF99, family=poisson) 
 +glm2 
 +summary(glm1) 
 +anova(glm1) 
 +## 
 +## comparando os ajustes 
 +anova(glm2, glm1, test="Chisq"
 +## Portanto a informação individual de cada vila é relevante. 
 +## Entretanto, como exemplo vamos supor que não dispomos da informação individual 
 +## e apenas o tipo de vila. 
 +## Neste caso o ajuste não é bom e vamos tentar alternativas 
 +## 1. Modelo com interação 
 +glm3 <glm(containers ~ viltype * education, data=DHF99, family=poisson) 
 +anova(glm2, glm3, test="Chisq"
 +anova(glm2, glm3, test="F"
 +## 2. Modelo Binomial negativo 
 +require(MASS) 
 +glm2BN <- glm.nb(containers ~ viltype + education, data=DHF99) 
 +glm2BN 
 +c(poisson=logLik(glm2), BN=logLik(glm2BN)) 
 +c(poisson=deviance(glm2), BN=deviance(glm2BN)) 
 +c(poisson=AIC(glm2), BN=AIC(glm2BN)) 
 +## comparando os coeficientes e erros padrão 
 +summary(glm2) 
 +summary(glm2BN) 
 +## 3. Modelo quasipoisson 
 +glm2Q <- 
 + glm(containers ~ viltype + education, data=DHF99, family=quasipoisson) 
 +## comparando os coeficientes e erros padrão 
 +summary(glm2) 
 +summary(glm2Q) 
 +## Note que os ajustes poderiam ser avaliados em mais detalhes 
 +par(mfrow=c(2,2)) 
 +plot(glm1) 
 +plot(glm2) 
 +plot(glm3) 
 +plot(glm2BN) 
 +## 
 +## As análises poderiam prosseguir de diversas formas. Alguns exemplos: 
 +## - avaliando ainda outros modelos como por exemplo inflacionados de de zeros, hurdle . 
 +## - verificando a relevância das covariáveis (e.g education) 
 +## Caso as vilas fossem consideradas poderia-se avaliar modelos mistos como vilas como efeito aleatórios
 </code> </code>
  

QR Code
QR Code disciplinas:ce225-2012-02:historico (generated for current page)