Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anteriorRevisão anteriorPróxima revisão | Revisão anterior | ||
projetos:hipertensao [2007/12/06 09:52] – joel | projetos:hipertensao [2007/12/17 20:27] (atual) – joel | ||
---|---|---|---|
Linha 1: | Linha 1: | ||
- | [[http:// | ||
- | |||
===== Participantes ===== | ===== Participantes ===== | ||
- [[pessoais: | - [[pessoais: | ||
Linha 9: | Linha 7: | ||
===== Objetivos ===== | ===== Objetivos ===== | ||
- | Geral : Aplicar técnicas multivariadas | + | Geral : Aplicar técnicas multivariadas |
- | Específicos | + | Específicos |
- | - Aplicar | + | - aplicar |
- | - Aplicar | + | - aplicar |
- | - Comparar | + | - comparar |
- | - Avaliar a importância das variáveis explicativas | + | - levantar, por diferentes metodologias, |
===== Metodologia ===== | ===== Metodologia ===== | ||
- | |||
- | |||
- | |||
- | |||
==== Métodos Multivariados. ==== | ==== Métodos Multivariados. ==== | ||
+ | * Clusterização pelo método das k-médias | ||
* Regressão Logística | * Regressão Logística | ||
- | * Clusterização | ||
* Análise Linear Discriminante | * Análise Linear Discriminante | ||
* Árvores de Decisão | * Árvores de Decisão | ||
Linha 35: | Linha 29: | ||
=== Análise de Cluster === | === Análise de Cluster === | ||
- | Análise de Cluster é um conjunto de técnicas utilizadas na identificação de padrões de comportamento em bancos de dados através da formação de grupos homogêneos. (SEAGRO) | ||
- | O objetivo da analise de cluster é agrupar as observações semelhantes de forma que cada grupo seja homogêneo internamente e sejam diferentes entre si. | ||
- | O primeiro passo da analise de cluster é encontrar as medidas de similaridade. Em seguida deve-se decidir qual a técnica de clusterização será utilizada (hierárquica ou não hierárquica). O terceiro passo é decidir o método de clusterização para a técnica que já foi selecionada (exemplo: método do centróide | ||
- | |||
- | 3.2.1 Medidas de similaridade | ||
- | |||
- | Cada objeto é representado por um ponto no espaço n-dimensional e, portanto, pode ser agrupado com outros que estejam próximos e mais se assemelham a ele. Dois critérios de melhor associação podem ser utilizados. | ||
- | |||
- | 1. Covariância e Correlação | ||
- | |||
- | Partindo da matriz de dados D (mxn), obtém-se a matriz de covariância C, onde seus elementos são dados por: | ||
- | |||
- | |||
- | ckl é grande e positivo quando, para a maior parte das amostras, os valores das variáveis k e l desviam da média na mesma direção. Portanto, a covariância de duas variáveis é uma medida de sua associação. Para cada elemento da matriz de covariância pode ser calculado o coeficiente de correlação, | ||
- | | ||
- | onde sk e s1 são os desvios padrões das variáveis K e 1 | ||
- | Os valores de rkl são uma covariância padronizada entre -1 e +1. | ||
- | |||
- | 2. Medidas de distâncias | ||
- | |||
- | Na análise de agrupamentos (cluster analysis) a similaridade entre duas amostras pode ser expressa como uma função da distância entre os dois pontos representativos destas amostras no espaço n-dimensional. Existem várias formas de de calcular a distância entre dois pontos a e b no espaço n-dimensional: | ||
- | |||
- | Distancia Euclidiana | ||
- | É a maneira mais usual de calcular a distância entre dois pontos (xab). É uma medida invariante a translações, | ||
- | |||
- | |||
- | |||
- | Distância de Mahalanobis: | ||
- | Considera que as superfícies de cada classe são elipsóides centradas na média. No caso especial em que a covariância é zero e a variância é a mesma para todas as variáveis, as superfícies são esferas e a distancia de Mahalanobis fica equivalente a distancia euclidiana. Pode ser utilizada para medir a distância entre classes de padrões. Isso pode ser feito através da soma ou da média da distância entre todos os padrões de duas classes diferentes. | ||
- | |||
- | Distancia de Manhattan ou “city-block” | ||
- | A distancia de manhattan é uma simplificação da distancia euclidiana, por isso é mais simples e sua emplementação é mais fácil. É mais eficiente para aplicações em tempo real devido a sua simplicidade (Kugler, 2003). | ||
- | |||
+ | Denomina-se Análise de Cluster ou Análise de Agrupamentos o conjunto de técnicas utilizadas na identificação de padrões de comportamento em bancos de dados através da formação de grupos homogêneos. O objetivo da analise de cluster é agrupar objetos ou variáveis semelhantes de forma que cada grupo seja homogêneo internamente e sejam diferentes entre si. | ||
=== Árvores de Decisão === | === Árvores de Decisão === | ||
Linha 86: | Linha 48: | ||
Neste trabalho será realizada somente a análise linear discriminante (LDA). Outros tipos de análise discriminante são: QDA(Quadratic Discriminant Analysis), FDA(Flexible Discriminant Analysis), PDA(Penalized Discriminant Analysis) e MDA(Mixture Discriminant Analysis). A função lda() presente no pacote MASS do R realiza análise linear discriminante. É importante notar que para a construção da função linear discriminante os preditores devem ser quantitativos e assume-se matrizes de covariância iguais nos grupos. | Neste trabalho será realizada somente a análise linear discriminante (LDA). Outros tipos de análise discriminante são: QDA(Quadratic Discriminant Analysis), FDA(Flexible Discriminant Analysis), PDA(Penalized Discriminant Analysis) e MDA(Mixture Discriminant Analysis). A função lda() presente no pacote MASS do R realiza análise linear discriminante. É importante notar que para a construção da função linear discriminante os preditores devem ser quantitativos e assume-se matrizes de covariância iguais nos grupos. | ||
- | |||
=== Redes Neurais Artificiais === | === Redes Neurais Artificiais === | ||
- | |||
Apesar de todo mito que envolve o uso de Redes Neurais Artificiais, | Apesar de todo mito que envolve o uso de Redes Neurais Artificiais, | ||
Linha 137: | Linha 97: | ||
* {{projetos: | * {{projetos: | ||
* {{projetos: | * {{projetos: | ||
+ | * {{projetos: | ||
===== Funções do R ===== | ===== Funções do R ===== | ||
Linha 143: | Linha 104: | ||
[[http:// | [[http:// | ||
(SOM) de Kohonen no R]] | (SOM) de Kohonen no R]] | ||
- | |||
===== Scripts do R ===== | ===== Scripts do R ===== | ||
- | < | + | < |
# pacotes necessarios | # pacotes necessarios | ||
require(MASS) | require(MASS) | ||
+ | |||
require(tree)# | require(tree)# | ||
+ | |||
require(rpart)# | require(rpart)# | ||
# Leitura do conjunto de dados | # Leitura do conjunto de dados | ||
dados< | dados< | ||
- | |||
- | # Re-expressão das variáveis | ||
- | dados< | ||
</ | </ | ||
Linha 321: | Linha 280: | ||
==== Criação das Bases de Desenvolvimento e de Validação ==== | ==== Criação das Bases de Desenvolvimento e de Validação ==== | ||
- | < | + | < |
< | < | ||
ind< | ind< | ||
Linha 332: | Linha 291: | ||
- | < | + | < |
dadostrein< | dadostrein< | ||
dadostest< | dadostest< | ||
</ | </ | ||
- | |||
===== Bibliografias ===== | ===== Bibliografias ===== | ||
Linha 356: | Linha 314: | ||
address = {}, | address = {}, | ||
year = {2002}, | year = {2002}, | ||
+ | } | ||
+ | </ | ||
+ | |||
+ | < | ||
+ | @Book{hair+tatham+anderson+black: | ||
+ | author = {Hair, Joseph F. AND Tatham; Ronald L. AND Anderson, Rolph E. AND Black, William}, | ||
+ | title = {Multivariate Data Analysis}, | ||
+ | note = {Tradu\c{c}\~{a}o: | ||
+ | pages = {}, | ||
+ | publisher = {Bookman}, | ||
+ | address = {Porto Alegre}, | ||
+ | year = {2006}, | ||
} | } | ||
</ | </ | ||
Linha 363: | Linha 333: | ||
@article{ABC2422007, | @article{ABC2422007, | ||
author = {ABC da Saúde}, | author = {ABC da Saúde}, | ||
- | title = {{Hipertensão Arterial - Crise Hipertensiva}}, | + | title = {Hipertensão Arterial - Crise Hipertensiva}, |
language = {pt}, | language = {pt}, | ||
note = {http:// | note = {http:// | ||
Linha 425: | Linha 395: | ||
} | } | ||
- | @Book{HAIR2006, | + | |
- | author = {Hair, Joseph F. AND Tatham; Ronald L. AND Anderson, Rolph E. AND Black, William}, | + | |
- | title = {{Multivariate Data Analysis}}, | + | |
- | note = {Tradu\c{c}\~{a}o: | + | |
- | pages = {}, | + | |
- | publisher = {Bookman}, | + | |
- | address = {Porto Alegre}, | + | |
- | year = {2006}, | + | |
- | } | + | |
@Book{HOFFMANN1977, | @Book{HOFFMANN1977, | ||
Linha 649: | Linha 611: | ||
@book{COSTANETO1977, | @book{COSTANETO1977, | ||
author = {Costa Neto, Pedro Luís de Oliveira}, | author = {Costa Neto, Pedro Luís de Oliveira}, | ||
- | title = {{Estatística}}, | + | title = {Estatística}, |
note = {14ª reimpressão}, | note = {14ª reimpressão}, | ||
pages = {39 - 45}, | pages = {39 - 45}, | ||
Linha 681: | Linha 643: | ||
} | } | ||
- | @Manual{GIOLO2006, | + | @unpublished{GIOLO2006, |
author = {Giolo, Suely Ruiz}, | author = {Giolo, Suely Ruiz}, | ||
- | title = {{Análise de Dados Categóricos}}, | + | title = {Análise de Dados Categóricos}, |
- | note = {Apostila e Notas de Aula}, | + | note = {notas de aula para o Curso de Estatística da UFPR}, |
- | pages = {}, | + | |
- | publisher = {UFPR}, | + | |
address = {Curitiba}, | address = {Curitiba}, | ||
year = {2006}, | year = {2006}, | ||
Linha 692: | Linha 652: | ||
- | @Manual{GIOLO2007, | + | @unpublished{GIOLO2007, |
author = {Giolo, Suely Ruiz}, | author = {Giolo, Suely Ruiz}, | ||
- | title = {{Análise de Regressão}}, | + | title = {Análise de Regressão}, |
- | note = {Apostila e Notas de Aula}, | + | note = {Notas de aula para o Curso de Estatística da UFPR}, |
pages = {}, | pages = {}, | ||
- | publisher = {UFPR}, | ||
address = {Curitiba}, | address = {Curitiba}, | ||
year = {2007}, | year = {2007}, | ||
Linha 716: | Linha 675: | ||
@Manual{OGLIARI2007, | @Manual{OGLIARI2007, | ||
author = {Ogliari, Paulo José}, | author = {Ogliari, Paulo José}, | ||
- | title = {{Regressão Logística}}, | + | title = {Regressão Logística}, |
note = {Curso On-Line - http:// | note = {Curso On-Line - http:// | ||
pages = {}, | pages = {}, | ||
Linha 737: | Linha 696: | ||
- | ===== Laboratórios de Estatística ===== | ||
- | |||
- | === == ==== Flaviane Peccin ==== == === | ||
- | |||
- | Artigo: {{projetos: | ||
- | |||
- | Apresentação: | ||
- | |||
- | Apresentação 2: 24/10/2007 - Grupo II | ||
- | |||
- | |||
- | === == ==== Christine Cardozo de Araujo ==== == === | ||
- | |||
- | Artigo: Projeto Bambuí-MG | ||
- | |||
- | Apresentação 1: 05/09/2007 - Grupo I | ||
- | Apresentação 2: 24/10/2007 - Grupo I | ||
===== Modelos para Redação do TCC ===== | ===== Modelos para Redação do TCC ===== |