Tabela de conteúdos

Probabilidades

Introdução

Na semana anterior, foram enfatizados alguns conceitos relacionados à estatística descritiva . Nesta semana, será apresentada a base teórica para muitas técnicas estatísticas de caráter inferencial.

Para entender a motivação em estudar o cálculo de probabilidades, imagine que um pesquisador selecione uma amostra de pacientes e registrou a idade e pressão arterial. Com base nesta amostra, ele identificou uma relação entre estas duas variáveis. O pesquisador pensa em estender as conclusões do seu estudo para outros pacientes, ou seja, fazer inferência. Neste exemplo específico, cabe a pergunta: a relação entre pressão e idade encontrada se deu ao acaso, ou há fortes indícios de que ela seja verdadeira ? A resposta à esta pergunta estará baseada no cálculo de probabilidades.

O cálculo de probabilidades é um importante ramo da teoria matemática, desenvolvido a partir da resolução de problemas em jogos de azar, que se destina a estudar fenômenos aleatórios. Estes fenômenos representam situações ou acontecimentos sobre os quais não há como predizer seus resultados. O cotidiano está repleto de fenômenos aleatórios. Veja por exemplo o resultado do lançamento de uma moeda, o tempo de espera em uma fila de banco e o retorno de um investimento de rentabilidade variável. Em todas estas situações, não é possível predizer com absoluta certeza qual será o resultado final.


Espaço Amostral

O conjunto Ω de todos os possíveis resultados de um fenômeno aleatório é chamado espaço amostral.

Veja alguns exemplos de fenômenos aleatórios e espaços amostrais:

Nos exemplos acima, os dois primeiros conjuntos são finitos, enquanto o terceiro contém infinitos elementos,por se tratar de um intervalo. Esta será uma importante classificação para os espaços amostrais: finitos e infinitos.

Veja a lista de outros fenômenos aleatórios presentes em nosso cotidiano.


Eventos

Os subconjuntos de Ω são chamados de eventos e, geralmente, representados por letras maiúsculas do alfabeto; A,B,C,…

Considere alguns eventos relacionados aos espaços amostrais descritos anteriormente:

<latex>A=\left\lbrace2,4,6\right\rbrace</latex>

<latex>B=\left\lbrace 1,2,3,5\right\rbrace</latex>

<latex> C =\left(6h,12h\right)</latex>

, alternativamente:

<latex>C =\left\lbrace t \in \mathbb{R} :0<t<6 \right\rbrace</latex>

Ressalta-se que ao lidarmos com eventos, estamos lidando com conjuntos e, por isto, é importante conhecimento sobre a Teoria dos Conjuntos, principalmente suas operações básicas (união, interseção,complemento,…).

Alguns importantes conceitos na Teoria dos Conjuntos


Probabilidade

É uma função P(.) que associa números reais aos elementos do espaço amostral e satisfaz os 3 axiomas:

  1. <latex> 0 \leq P(A) \leq 1</latex>
  2. <latex> P(\Omega)=1 </latex>
  3. <latex> P(\cup_{j=1}^{n}A_{j})=\sum_{j=1}^n P(A_{j}) </latex> para <latex>A_1,A_2,…,A_n</latex> disjuntos.

Dois eventos A e B são disjuntos se A ∩ B = <latex>\emptyset</latex>

A função P(.) faz um mapeamento de conjuntos em números reais.

Uma importante questão é a atribuição das probabilidades aos elementos do espaço amostral. Duas abordagens são comuns: atribuição a priori e a posteriori.

A priori :Considere um espaço amostral com n eventos elementares

<latex>\Omega=\lbrace A_{1},A_{2},\ldots,A_{n}\rbrace</latex>

caso não haja justificativas para atribuir maior probabilidade a um determinado ponto, é natural imaginar que as chances estão igualmente distribuídas nestes n eventos e, portanto:

<latex>P(A_{i})=\displaystyle \frac{1}{n}</latex>

para i=1,2,…,n.

A atribuição de probabilidades a priori é feita quando se há conhecimento sobre as características físicas do experimento, como por exemplo no lançamento da moeda e do dado. Por outro lado, se não há conhecimento sobre as chances do eventos no espaço amostral, as probabilidades são atribuídas após repetidas observações do fenômeno aleatório.


Exemplo: Ao lançar um dado e observar o resultado obtido na face superior, as características físicas do experimento nos levam a atribuir probabilidades do seguinte modo:

<latex> \Omega=\lbrace1,2,3,4,5,6\rbrace\ </latex>

<latex> P(A_{1})=P(A_{2})=P(A_{3})=P(A_{4})=P(A_{5})=P(A_{6})=\displaystyle\frac{1}{6} </latex>

e nesta situação, as probabilidades são atribuídas a priori.


A posteriori : Quando não há conhecimento a priori das probabilidades, elas podem ser atribuídas através da experimentação. Observe o exemplo abaixo:


Exemplo: Seja a inspeção de peças em um processo de fabricação e os seguintes eventos A={Peça Defeituosa} e B ={Peça Perfeita}. Após inspecionar 1000 peças, verificou-se que 350 eram defeituosas. A partir deste experimento, ao selecionar aleatóriamente uma peça, pode-se atribuir as seguintes probabilidades:

<latex>P(A)=\displaystyle\frac{350}{1000}=0,35</latex>

<latex>P(B)=\displaystyle\frac{650}{1000}=0,65</latex>

que são calculadas a posteriori, pela frequência de situações favoráveis em relação aos casos possíveis.


Regra da Adição de Probabilidades

A probabilidade da união de eventos é calculada através da regra da adição conforme a equação abaixo.

<latex>P(A \cup B)=P(A)+P(B)-P(A \cap B)</latex>

Ilustração pelo Diagrama de Venn


Probabilidade Condicional e Independência

Existem situações em que a ocorrência de um determinado evento B altera a chance de ocorrência de outro evento A. A informação da ocorrência do evento B traz um ganho de informação e a probabilidade de A pode ser “recalculada”.

A probabilidade condicional é definida conforme a equação abaixo :

<latex> P(A|B)=\displaystyle\frac{P(A\cap B)}{P(B)}~,P(B)>0</latex>

É comum a leitura da expressão acima como “probabilidade de A dado (a ocorrência) B”.


Regra do Produto de Probabilidades

<latex> P(A\cap B)=P(A|B)P(B)</latex>


Independência de Eventos

<latex> P(A|B) = P(A), ~P(B) >0 </latex>

Se a ocorrência do evento B não altera a probabilidade de ocorrência do evento A, os eventos A e B são ditos serem independentes. A partir dos resultados apresentados acima, torna-se direta a verificação de que:

<latex> P(A\cap B)=P(A)P(B)</latex>

se A e B são eventos independentes.

Exemplo: Sejam dois lançamentos consecutivos de uma moeda honesta e a observação das faces superiores. Considere os eventos A={cara no primeiro lançamento} e B={cara no segundo lançamento}. Pelas características deste experimento, o resultado do primeiro lançamento não deve causar interferência na probabilidade de ocorrência de cara no segundo lançamento. De fato A e B são independentes e, portanto:

<latex>P(A\cap B)=P(A)P(B)=\displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2}=\displaystyle \frac{1}{4}</latex>

Veja o artigo : Entendendo Probabilidades Condicionais

Na área biológica existem vários exemplos de eventos dependentes e eventos independentes. Assim, olhos claros e cabelos claros são dois eventos dependentes porque a probabilidade de uma pessoa ter olhos claros é maior se a pessoa tem cabelos claros. Já “olhos claros” e “idade avançada” são eventos independentes pois um não modifica a probabilidade do outro.


Partição do Espaço Amostral

No Cálculo de Probabilidades, um conjunto de eventos que sejam mutuamente exclusivos entre si, ou seja, não tenham interseção e cuja união gere o espaço amostral irá constituir uma partição do espaço amostral. No trivial exemplo do lançamento de um dado honesto e observação da face superior, os eventos:

<latex>A_1=\lbrace 1 \rbrace,A_2=\lbrace 2 \rbrace,A_3=\lbrace 3 \rbrace,A_4=\lbrace 4 \rbrace,A_5=\lbrace 5 \rbrace,A_6=\lbrace 6\rbrace </latex>

formam uma partição trivial do espaço amostral. Eles não tem interseção entre si, ou seja, não posso obter ao mesmo tempo 1 e 6 no lançamento de um dado, e a união entre eles reconstitui o próprio espaço amostral.

<latex>\cup_{i=1}^6 A_i=\Omega</latex>

Para o mesmo fenômeno aleatório (face superior no lançamento de um dado honesto) existem outras formas de particionar o espaço amostral. Verifique, por exemplo, os eventos :

<latex>B_1=\lbrace \text{Números Pares}\rbrace = \lbrace 2,4,6 \rbrace </latex>

<latex>B_2=\lbrace \text{Números Ímpares} \rbrace = \lbrace 1,3,5 \rbrace </latex>

também formam uma partição do espaço amostral pois :

Caso haja conhecimento das probabilidades dos eventos que formam a partição, este fato pode auxiliar o cálculo de probabilidades de outros eventos conforme o exemplo abaixo.


Exemplo: Em um determinado banco, 20 % dos clientes pertencem à classe social A, 40 % à classe social B, 20 % à C e o restante à classe D. Portanto, Considerando os eventos: A = {pertencer a classe social A}, B={pertencer a classe social B}, C = {pertencer a classe social C} e D = {pertencer a classe social D}.: P(A)=0,20;P(B)=0,40;P(C)=0,20;P(D)=0,20 a situação de inadimplência ocorre nas classes sociais de acordo com os seguintes percentuais :

Tabela 2.1 - Inadimplência dentro das classes sociais

<latex> \begin{tabular}{ccccc} \hline \hline &\multicolumn{4}{c}{Classe Social}
situação & A & B & C & D
\hline Inadimplência & 5\% & 30\% & 20\% & 60\%
Adimplência & 95\% & 70 \% & 80\% & 40\%
\hline \end{tabular} </latex>

As informações desta tabela correspondem à probabilidades condicionais. Condicional ao fato de que o cliente pertence a classe A, sua probabilidade de inadimplência é 0,05.

Com estes dados, qual a probabilidade de sortear um cliente inadimplente ?

Note que no exemplo acima, as classes sociais formam a partição do espaço amostral constituído pelos clientes do banco. As probabilidades de cada elemento da partição também são conhecidas, mas a probabilidade de um cliente ser inadimplente, independentemente de sua classe social, ainda não é conhecida, devendo ser calculada.

Considere o evento <latex> I </latex> = {cliente inadimplente}. O cliente inadimplente deve obrigatoriamente pertencer a uma das classes sociais e, não pode pertencer a mais do que uma. Logo, a probabilidade de <latex> I </latex> pode ser expressa como :

<latex>P(I)=P(I\cap A)+P(I\cap B)+P(I\cap C)+P(I\cap D)</latex>

Entretanto, pela definição de probabilidade condicional, podemos re-expressar a probabilidade acima como:

<latex>P(I)=P(I|A)P(A)+P(I|B)P(B)+P(I|C)P(C)+P(I|D)P(D)</latex>

As probabilidades acima são todas conhecidas pois <latex>P(I|A),P(I|B),P(I|C) ~\text{e}~ P(I|D)</latex> são probabilidades de inadimplência condicionais ao conhecimento da classe social e foram fornecidas na Tabela 2.1.

Substituindo as respectivas probabilidades, a probabilidade de inadimplência será:

<latex> P(I) =(0,05*0,2)+(0,3*0,4)+(0,2*0,2)+(0,6*0,2)=0,29 </latex>

Conforme o cálculo acima, a probabilidade de sortear um cliente e este ser inadimplente é de 29 %.


A solução do problema acima, calcular a probabilidade de sortear este cliente e este ser inadimplente, foi encontrada mediante a utilização do chamado Teorema da Probabilidade Total. Abaixo enunciamos este teorema.

Teorema da Probabilidade Total

Seja uma partição do espaço amostral <latex>\Omega</latex>:

<latex> C_1,C_2,\ldots,C_n </latex>

Para qualquer evento A pertencente a este espaço amostral, podemos escrever sua probabilidade como :

<latex> P(A)=P(A\cap C_1)+P(A \cap C_2)+\ldots+P(A \cap C_n)</latex>

e usando a definição de probabilidade condicional;

<latex> P(A)=P(A|C_1)P(C_1)+P(A|C_2)P(C_2)+\ldots+P(A|C_n)P(C_n)</latex>


Teorema de Bayes

A razão entre as probabilidades condicionais é a mesma razão entre as probabilidades incondicionais.

<latex> \displaystyle \frac{P(A|B)}{P(B|A)} = \displaystyle \frac{P(A)}{P(B)} </latex>

Este resultado é geralmente expresso como:

<latex> P(B|A) = \displaystyle \frac{P(A|B)P(B)}{P(A)} </latex>

Considere uma partição C1,C2,…,Cn do espaço amostral Ω. A probabilidade condicional de um determinado elemento desta partição pode ser escrita como:

<latex> P(C_j|A) = \displaystyle \frac{P(A|C_j)P(C_j)}{P(A|C_1)P(C_1)+P(A|C_2)P(C_2)+\ldots+P(A|C_n)P(C_n)} </latex>

que corresponde a enunciação geral do Teorema de Bayes.

Veja aplicação de probabilidade em saúde: Avaliação da qualidade de testes diagnósticos