## Exemplo de aula, 18/04/2013
## Fonte dos dados: UCI - Machine learning data-sets
## http://archive.ics.uci.edu/ml/datasets.html
##
## Importando dados escolhidos (Auto MGP)
## na.st é o código para dado faltante utilizado no arquivo
## head=F indica que as colunas do arquivo não possuem cabeçalho
cars <- read.table("http://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data", na.st="?", head=F)
## informações sobr os dados
head(cars) ## primeiras linhas da tabela de dados
dim(cars) ## dimensoes da tabela de dado
str(cars) ## strutura de armazenamento dos dados
## atribuindo nomes para as colunas
names(cars) <- c("mpg","cyl","disp","hp","wei","acc","ano","origin","Modelo")
head(cars)
cars$origin <- factor(cars$origin, level=1:3, label=c("US","UE","JP"))
## Resumo de dados contínuos
## I . Medidas
with(cars, mean(mpg))
with(cars, min(mpg))
with(cars, max(mpg))
with(cars, range(mpg))
with(cars, fivenum(mpg))
with(cars, summary(mpg))
with(cars, var(mpg))
with(cars, sd(mpg))
## II. Tabelas
with(cars, table(cut(mpg, br=c(0, 15, 20, 25, 50))))
with(cars, prop.table(table(cut(mpg, br=c(0, 15, 20, 25, 50)))))
## III. Gráficos
with(cars, hist(mpg))
with(cars, stem(mpg))
with(cars, boxplot(mpg))
## Resumos para grupos (no caso mpg para cada ano)
with(cars, tapply(mpg, year, mean))
with(cars, tapply(mpg, year, max))
with(cars, tapply(mpg, ano, mean))
with(cars, plot(unique(ano), tapply(mpg, ano, mean), type="l"))
## subconjunto dos dados
with(subset(cars, origin=="EU"), plot(unique(year), tapply(mpg, year, mean), type="l"))
with(subset(cars, origin=="US"), lines(unique(year), tapply(mpg, year, mean), col=2))
with(subset(cars, origin=="JP"), lines(unique(year), tapply(mpg, year, mean), col=4))