Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anteriorRevisão anteriorPróxima revisão | Revisão anterior | ||
cursos:mct:exemplo1b [2011/05/26 22:11] – paulojus | cursos:mct:exemplo1b [2011/05/27 19:18] (atual) – paulojus | ||
---|---|---|---|
Linha 58: | Linha 58: | ||
Lendo as dados com colunas de tamanho definido | Lendo as dados com colunas de tamanho definido | ||
<code R> | <code R> | ||
- | foo <- read.fwf(" | + | foo <- read.fwf(" |
foo | foo | ||
</ | </ | ||
Linha 65: | Linha 65: | ||
Isto permite selecionar somente o que se quer ler. | Isto permite selecionar somente o que se quer ler. | ||
<code R> | <code R> | ||
- | read.fwf(" | + | read.fwf(" |
</ | </ | ||
Linha 81: | Linha 81: | ||
foo2 <- sapply(foo1, | foo2 <- sapply(foo1, | ||
foo2 | foo2 | ||
- | read.fwf(" | + | read.fwf(" |
</ | </ | ||
Linha 88: | Linha 88: | ||
foo3 <- sapply(foo1, | foo3 <- sapply(foo1, | ||
foo3 | foo3 | ||
- | foo3[is.na(foo3)] <- 0 | + | COLS <- !is.na(foo3) |
- | foo3 | + | COLS |
- | as.data.frame(sweep(data.matrix(foo), | + | |
+ | sweep(data.matrix(foo[, | ||
+ | foo[,COLS] <- sweep(data.matrix(foo[,COLS]), 2, 10^foo3[COLS], FUN="/" | ||
+ | foo | ||
</ | </ | ||
Linha 100: | Linha 103: | ||
Agora vamos montar uma função que concatena os comandos acima para facilitar a leitura de arquivos deste tipo sempre que preciso. | Agora vamos montar uma função que concatena os comandos acima para facilitar a leitura de arquivos deste tipo sempre que preciso. | ||
<code R> | <code R> | ||
- | read.meudado <- function(file, | + | read.meudado <- function(file, |
| | ||
| | ||
- | arq <- read.fwf(file, | + | arq <- read.fwf(file, |
| | ||
- | decimais[is.na(decimais)] <- 0 | + | COLS <- !is.na(decimais) |
- | arq <- as.data.frame(sweep(data.matrix(arq), | + | arq[, |
| | ||
- | } | + | } |
- | read.meudado(" | + | read.meudado(" |
</ | </ | ||
- | Limitações | + | Outro exemplo, os dados abaixo no arquivo '' |
- | - assume que todos os campos são numericos | + | < |
- | - ao final armazena todos os campos como numeric | + | |
+ | | ||
+ | | ||
+ | | ||
+ | </ | ||
+ | |||
+ | <code R> | ||
+ | read.fwf(" | ||
+ | |||
+ | DEC1 <- c(" | ||
+ | read.meudado(" | ||
+ | </ | ||
+ | |||
+ | Outro exemplo, os dados abaixo no arquivo '' | ||
+ | < | ||
+ | Dados no formato FWF | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | </ | ||
+ | |||
+ | Lendo com a função, note o uso do mecanismo de '' | ||
+ | |||
+ | <code R> | ||
+ | read.meudado(" | ||
+ | </ | ||
+ | |||
+ | ===== Dados reais da Regina ===== | ||
+ | Lendo arquivo descritor | ||
+ | <code R> | ||
+ | desc <- read.table(" | ||
+ | desc | ||
+ | desc$V3 | ||
+ | |||
+ | desc$V4 <- ifelse(desc$V2 == " | ||
+ | desc | ||
+ | desc$V4[grep(" | ||
+ | desc | ||
+ | </ | ||
+ | |||
+ | Lendo os dados usando nossa função. | ||
+ | <code R> | ||
+ | Regina <- read.meudado(" | ||
+ | #, skip=2, n=20) | ||
+ | Regina | ||
+ | |||
+ | ## algumas operacoes uteis: | ||
+ | which(grepl(" | ||
+ | which(desc$V4==" | ||
+ | which(grepl(" | ||
+ | Regina[, | ||
+ | apply(Regina[, | ||
+ | |||
+ | ## colocar aqui os nome dasd variaveis trabalhado/ | ||
+ | # | ||
+ | |||
+ | Regina$V29 | ||
+ | as.Date(as.character(Regina$V29), | ||
+ | |||
+ | Regina$V29 <- as.Date(as.character(Regina$V29), | ||
+ | |||
+ | Regina <- read.meudado(" | ||
+ | Regina | ||
+ | </ | ||
+ | |||
+ | Queremos ordenar | ||
+ | <code R> | ||
+ | x <- rpois(10, lam=10) | ||
+ | x | ||
+ | sort(x) | ||
+ | order(x) | ||
+ | x[order(x)] | ||
+ | x[rev(order(x))] | ||
+ | args(order) | ||
+ | order(x, decreasing=T) | ||
+ | </ | ||
+ | |||
+ | Agora de volta aos dados | ||
+ | <code R> | ||
+ | Regina <- Regina[order(Regina$V29), | ||
+ | Regina | ||
+ | Regina[, c(" | ||
+ | aggregate(V7+V8+V9 ~ V29, FUN=sum, data=Regina) | ||
+ | |||
+ | ## algumas manipulacoes | ||
+ | Regina[, | ||
+ | |||
+ | aggregate(. ~ V29, data=Regina[, | ||
+ | aggregate(V7+V8 ~ V29, data=Regina[, | ||
+ | aggregate(cbind(V7, | ||
+ | </ | ||
+ | |||
+ | |||
+ | ===== Um pequeno exemplo de análises automáticas ===== | ||
+ | |||
+ | Suponha que voce tem um diretório (pasta) com alguns arquivos que devem ser lidos e processados por análises\\ | ||
+ | |||
+ | Vamos supor aqui o diretório '' | ||
+ | < | ||
+ | dir.create(" | ||
+ | cat( | ||
+ | " | ||
+ | " | ||
+ | " | ||
+ | " | ||
+ | file = " | ||
+ | |||
+ | cat( | ||
+ | " | ||
+ | " | ||
+ | " | ||
+ | " | ||
+ | file = " | ||
+ | </ | ||
+ | |||
+ | Para cada um dos arquivos queremos:\\ | ||
+ | (i) ler os dados, | ||
+ | |||
+ | <code R> | ||
+ | arquivos <- dir(" | ||
+ | arquivos | ||
+ | |||
+ | names(arquivos) <- c(" | ||
+ | arquivos | ||
+ | |||
+ | resumo1 <- function(x){ | ||
+ | gastos <- read.table(x, | ||
+ | names(gastos) <- c(" | ||
+ | totM <- aggregate(Despesa ~ Mes, FUN = sum, data=gastos) | ||
+ | return(totM) | ||
+ | } | ||
+ | |||
+ | res <- lapply(arquivos, | ||
+ | res | ||
+ | |||
+ | require(R2HTML) | ||
+ | saida <- HTMLInitFile(" | ||
+ | HTML.title(" | ||
+ | HTML("< | ||
+ | lapply(res, HTML, file=saida) | ||
+ | HTMLEndFile() | ||
+ | </ | ||