Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Ambos lados da revisão anteriorRevisão anterior
Próxima revisão
Revisão anterior
projetos:modeltrees [2008/04/27 10:51] joelprojetos:modeltrees [2008/11/07 19:24] (atual) joel
Linha 7: Linha 7:
  
   *[[pessoais:camila|Camila Epprechet]]   *[[pessoais:camila|Camila Epprechet]]
 +  
 +  *[[pessoais:taconeli|César Taconeli]]
 +  
 +  *[[pessoais:paulojus|Paulo Justiniano]]
  
   *[[pessoais:alvaro|Alvaro Veiga]]   *[[pessoais:alvaro|Alvaro Veiga]]
Linha 21: Linha 25:
 ===== Introdução ===== ===== Introdução =====
  
-Os modelos estruturados por árvores, também conhecidos como árvores de decisão, podem ser vistos como métodos não paramétricos  de regressão. O princípio destes modelos é o particionamento recursivo do espaço das variáveis e o ajuste de modelos simples em cada partição+As Árvores de Classificação e Regressão compõem um conjunto de métodos de particionamento recursivo que geram regras de decisão para problemas de classificação regressão que podem ser facilmente interpretadas. Algoritmos como CHAID, CART, QUEST e C4.5, dentre outros, popularizaram estes métodos em várias comunidades científicas.
  
-Devido a fácil interpretação gerada por este modelo seu uso tornou-se comum em diferentes áreas como: medicina diagnósticaescoragem  de crédito classificação de populações.+O grande poder preditivo destes métodos foi comprovado nas tradicionais competições KDD nas quais diversas metodologias exploratórias de dados concorrem para extração de conhecimento em diferentes bases. Mais recentementemétodos de boosting bagging potencializaram ainda mais o uso destes métodos.
  
-Quando a variável resposta é uma classe, estes modelos são denominados árvores de classificação e quando ela é contínua, são chamados árvores de regressão. 
- 
-Muitos algoritmos foram desenvolvidos para realizar o particionamento recursivo, dentre eles: CHAID, CART, QUEST, C4.5,... 
- 
-Uma das desvantagens destes algoritmos é a instabilidade do modelo final. Pequenas mudanças na base de dados pode gerar diferentes modelos. Por este motivo, são adotadas saídas como Bagging e Boosting para problemas que a finalidade é preditiva. 
  
 ==== Artigos ==== ==== Artigos ====
Linha 40: Linha 39:
    * {{projetos:modeltree:a-comparison-of-logistic.pdf|Comparação Regressão Logística x Árvore de Decisão}}    * {{projetos:modeltree:a-comparison-of-logistic.pdf|Comparação Regressão Logística x Árvore de Decisão}}
    * {{projetos:modeltree:cart_area_medica.pdf|Aplicação do CART na Área Médica}}    * {{projetos:modeltree:cart_area_medica.pdf|Aplicação do CART na Área Médica}}
 +==== Trabalhos Acadêmicos ====
  
-==== Programas ====+ 
 +{{:projetos:modeltrees:tese_bernardo_v10.doc|Dissertação de Mestrado de Bernardo Spindel}} 
 + 
 +{{:projetos:modeltrees:tesecesartaconeli.pdf|Tese de Doutorado de César Taconeli}} 
 + 
 +{{:pessoais:dissertacao_rm.pdf|Dissertação de Mestrado de Rodrigo Moreira}} 
 + 
 +==== Recursos Computacionais ====
 {{projetos:modeltrees:treestar1.zip|Star-Tree}} {{projetos:modeltrees:treestar1.zip|Star-Tree}}
 +
 +<code>
 +require(rpart)
 +z.auto <- rpart(Mileage ~ Weight, car.test.frame)
 +post(z.auto, file = ""  # display tree on active device
 +   # now construct postscript version on file "pretty.ps"
 +   # with no title
 +post(z.auto, file = "pretty.ps", title = " ")
 +z.hp <- rpart(Mileage ~ Weight + HP, car.test.frame)
 +post(z.hp)
 +</code>
 +==== Conjuntos de Dados ====
 +
 +=== Classificação de solos segundo atributos químicos ===
 +{{:projetos:modeltrees:guilhermecluster.rnw|Analise de Cluster + Arvores de Classificação - Guilherme Brenner}}
 +{{:projetos:modeltrees:quimicos_c1.txt|Atributos Químicos de Solos}}
 +{{:projetos:modeltrees:quimicos_c2.txt|Atributos Químicos de Solos}}
 + 
 +=== Identificação de Fatores de Risco para Hipertensão===
 +
 +<code>
 +dados<-read.csv2('http://www.leg.ufpr.br/~joel/dados/hiipertensao.csv',na.strings="")
 +</code>
 +
 +{{projetos:dados_hipertenso.txt|Banco de Dados - Hipertensão}}
 +
 +{{pessoais:tinetoon:nomesvariaveis.xls|Nome das Variáveis - Hipertensão}}
  
 ==== Links de Interesse ==== ==== Links de Interesse ====
Linha 66: Linha 100:
 } }
 </bibtex> </bibtex>
- 

QR Code
QR Code projetos:modeltrees (generated for current page)