Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
| Ambos lados da revisão anteriorRevisão anteriorPróxima revisão | Revisão anterior | ||
| cursos:mct:exemplo1b [2011/05/26 22:11] – paulojus | cursos:mct:exemplo1b [2011/05/27 19:18] (atual) – paulojus | ||
|---|---|---|---|
| Linha 58: | Linha 58: | ||
| Lendo as dados com colunas de tamanho definido | Lendo as dados com colunas de tamanho definido | ||
| <code R> | <code R> | ||
| - | foo <- read.fwf(" | + | foo <- read.fwf(" |
| foo | foo | ||
| </ | </ | ||
| Linha 65: | Linha 65: | ||
| Isto permite selecionar somente o que se quer ler. | Isto permite selecionar somente o que se quer ler. | ||
| <code R> | <code R> | ||
| - | read.fwf(" | + | read.fwf(" |
| </ | </ | ||
| Linha 81: | Linha 81: | ||
| foo2 <- sapply(foo1, | foo2 <- sapply(foo1, | ||
| foo2 | foo2 | ||
| - | read.fwf(" | + | read.fwf(" |
| </ | </ | ||
| Linha 88: | Linha 88: | ||
| foo3 <- sapply(foo1, | foo3 <- sapply(foo1, | ||
| foo3 | foo3 | ||
| - | foo3[is.na(foo3)] <- 0 | + | COLS <- !is.na(foo3) |
| - | foo3 | + | COLS |
| - | as.data.frame(sweep(data.matrix(foo), | + | |
| + | sweep(data.matrix(foo[, | ||
| + | foo[,COLS] <- sweep(data.matrix(foo[,COLS]), 2, 10^foo3[COLS], FUN="/" | ||
| + | foo | ||
| </ | </ | ||
| Linha 100: | Linha 103: | ||
| Agora vamos montar uma função que concatena os comandos acima para facilitar a leitura de arquivos deste tipo sempre que preciso. | Agora vamos montar uma função que concatena os comandos acima para facilitar a leitura de arquivos deste tipo sempre que preciso. | ||
| <code R> | <code R> | ||
| - | read.meudado <- function(file, | + | read.meudado <- function(file, |
| | | ||
| | | ||
| - | arq <- read.fwf(file, | + | arq <- read.fwf(file, |
| | | ||
| - | decimais[is.na(decimais)] <- 0 | + | COLS <- !is.na(decimais) |
| - | arq <- as.data.frame(sweep(data.matrix(arq), | + | arq[, |
| | | ||
| - | } | + | } |
| - | read.meudado(" | + | read.meudado(" |
| </ | </ | ||
| - | Limitações | + | Outro exemplo, os dados abaixo no arquivo '' |
| - | - assume que todos os campos são numericos | + | < |
| - | - ao final armazena todos os campos como numeric | + | |
| + | | ||
| + | | ||
| + | | ||
| + | </ | ||
| + | |||
| + | <code R> | ||
| + | read.fwf(" | ||
| + | |||
| + | DEC1 <- c(" | ||
| + | read.meudado(" | ||
| + | </ | ||
| + | |||
| + | Outro exemplo, os dados abaixo no arquivo '' | ||
| + | < | ||
| + | Dados no formato FWF | ||
| + | | ||
| + | | ||
| + | | ||
| + | | ||
| + | | ||
| + | </ | ||
| + | |||
| + | Lendo com a função, note o uso do mecanismo de '' | ||
| + | |||
| + | <code R> | ||
| + | read.meudado(" | ||
| + | </ | ||
| + | |||
| + | ===== Dados reais da Regina ===== | ||
| + | Lendo arquivo descritor | ||
| + | <code R> | ||
| + | desc <- read.table(" | ||
| + | desc | ||
| + | desc$V3 | ||
| + | |||
| + | desc$V4 <- ifelse(desc$V2 == " | ||
| + | desc | ||
| + | desc$V4[grep(" | ||
| + | desc | ||
| + | </ | ||
| + | |||
| + | Lendo os dados usando nossa função. | ||
| + | <code R> | ||
| + | Regina <- read.meudado(" | ||
| + | #, skip=2, n=20) | ||
| + | Regina | ||
| + | |||
| + | ## algumas operacoes uteis: | ||
| + | which(grepl(" | ||
| + | which(desc$V4==" | ||
| + | which(grepl(" | ||
| + | Regina[, | ||
| + | apply(Regina[, | ||
| + | |||
| + | ## colocar aqui os nome dasd variaveis trabalhado/ | ||
| + | # | ||
| + | |||
| + | Regina$V29 | ||
| + | as.Date(as.character(Regina$V29), | ||
| + | |||
| + | Regina$V29 <- as.Date(as.character(Regina$V29), | ||
| + | |||
| + | Regina <- read.meudado(" | ||
| + | Regina | ||
| + | </ | ||
| + | |||
| + | Queremos ordenar | ||
| + | <code R> | ||
| + | x <- rpois(10, lam=10) | ||
| + | x | ||
| + | sort(x) | ||
| + | order(x) | ||
| + | x[order(x)] | ||
| + | x[rev(order(x))] | ||
| + | args(order) | ||
| + | order(x, decreasing=T) | ||
| + | </ | ||
| + | |||
| + | Agora de volta aos dados | ||
| + | <code R> | ||
| + | Regina <- Regina[order(Regina$V29), | ||
| + | Regina | ||
| + | Regina[, c(" | ||
| + | aggregate(V7+V8+V9 ~ V29, FUN=sum, data=Regina) | ||
| + | |||
| + | ## algumas manipulacoes | ||
| + | Regina[, | ||
| + | |||
| + | aggregate(. ~ V29, data=Regina[, | ||
| + | aggregate(V7+V8 ~ V29, data=Regina[, | ||
| + | aggregate(cbind(V7, | ||
| + | </ | ||
| + | |||
| + | |||
| + | ===== Um pequeno exemplo de análises automáticas ===== | ||
| + | |||
| + | Suponha que voce tem um diretório (pasta) com alguns arquivos que devem ser lidos e processados por análises\\ | ||
| + | |||
| + | Vamos supor aqui o diretório '' | ||
| + | < | ||
| + | dir.create(" | ||
| + | cat( | ||
| + | " | ||
| + | " | ||
| + | " | ||
| + | " | ||
| + | file = " | ||
| + | |||
| + | cat( | ||
| + | " | ||
| + | " | ||
| + | " | ||
| + | " | ||
| + | file = " | ||
| + | </ | ||
| + | |||
| + | Para cada um dos arquivos queremos:\\ | ||
| + | (i) ler os dados, | ||
| + | |||
| + | <code R> | ||
| + | arquivos <- dir(" | ||
| + | arquivos | ||
| + | |||
| + | names(arquivos) <- c(" | ||
| + | arquivos | ||
| + | |||
| + | resumo1 <- function(x){ | ||
| + | gastos <- read.table(x, | ||
| + | names(gastos) <- c(" | ||
| + | totM <- aggregate(Despesa ~ Mes, FUN = sum, data=gastos) | ||
| + | return(totM) | ||
| + | } | ||
| + | |||
| + | res <- lapply(arquivos, | ||
| + | res | ||
| + | |||
| + | require(R2HTML) | ||
| + | saida <- HTMLInitFile(" | ||
| + | HTML.title(" | ||
| + | HTML("< | ||
| + | lapply(res, HTML, file=saida) | ||
| + | HTMLEndFile() | ||
| + | </ | ||