Tabela de conteúdos
Probabilidades
Introdução
Na semana anterior, foram enfatizados alguns conceitos relacionados à estatística descritiva . Nesta semana, será apresentada a base teórica para muitas técnicas estatísticas de caráter inferencial.
Para entender a motivação em estudar o cálculo de probabilidades, imagine que um pesquisador selecione uma amostra de pacientes e registrou a idade e pressão arterial. Com base nesta amostra, ele identificou uma relação entre estas duas variáveis. O pesquisador pensa em estender as conclusões do seu estudo para outros pacientes, ou seja, fazer inferência. Neste exemplo específico, cabe a pergunta: a relação entre pressão e idade encontrada se deu ao acaso, ou há fortes indícios de que ela seja verdadeira ? A resposta à esta pergunta estará baseada no cálculo de probabilidades.
O cálculo de probabilidades é um importante ramo da teoria matemática, desenvolvido a partir da resolução de problemas em jogos de azar, que se destina a estudar fenômenos aleatórios. Estes fenômenos representam situações ou acontecimentos sobre os quais não há como predizer seus resultados. O cotidiano está repleto de fenômenos aleatórios. Veja por exemplo o resultado do lançamento de uma moeda, o tempo de espera em uma fila de banco e o retorno de um investimento de rentabilidade variável. Em todas estas situações, não é possível predizer com absoluta certeza qual será o resultado final.
Espaço Amostral
O conjunto Ω de todos os possíveis resultados de um fenômeno aleatório é chamado espaço amostral.
Veja alguns exemplos de fenômenos aleatórios e espaços amostrais:
- Lançamento de um dado honesto: Ω={1,2,3,4,5,6}
- Lançamento de uma moeda honesta: Ω={cara,coroa}
- Horário de ocorrência de queda de energia durante o dia Ω=(0h,24h)
Nos exemplos acima, os dois primeiros conjuntos são finitos, enquanto o terceiro contém infinitos elementos,por se tratar de um intervalo. Esta será uma importante classificação para os espaços amostrais: finitos e infinitos.
Veja a lista de outros fenômenos aleatórios presentes em nosso cotidiano.
Eventos
Os subconjuntos de Ω são chamados de eventos e, geralmente, representados por letras maiúsculas do alfabeto; A,B,C,…
Considere alguns eventos relacionados aos espaços amostrais descritos anteriormente:
- Evento A: Números pares obtidos em um lançamento de dado honesto.
<latex>A=\left\lbrace2,4,6\right\rbrace</latex>
- Evento B: Números primos obtidos em um lançamento de dado honesto.
<latex>B=\left\lbrace 1,2,3,5\right\rbrace</latex>
- Evento C :Horário de ocorrência de queda de energia no período da manhã situado entre 6:00h as 12:00h
<latex> C =\left(6h,12h\right)</latex>
, alternativamente:
<latex>C =\left\lbrace t \in \mathbb{R} :0<t<6 \right\rbrace</latex>
Ressalta-se que ao lidarmos com eventos, estamos lidando com conjuntos e, por isto, é importante conhecimento sobre a Teoria dos Conjuntos, principalmente suas operações básicas (união, interseção,complemento,…).
Alguns importantes conceitos na Teoria dos Conjuntos
Probabilidade
É uma função P(.) que associa números reais aos elementos do espaço amostral e satisfaz os 3 axiomas:
- <latex> 0 \leq P(A) \leq 1</latex>
- <latex> P(\Omega)=1 </latex>
- <latex> P(\cup_{j=1}^{n}A_{j})=\sum_{j=1}^n P(A_{j}) </latex> para <latex>A_1,A_2,…,A_n</latex> disjuntos.
Dois eventos A e B são disjuntos se A ∩ B = <latex>\emptyset</latex>
A função P(.) faz um mapeamento de conjuntos em números reais.
Uma importante questão é a atribuição das probabilidades aos elementos do espaço amostral. Duas abordagens são comuns: atribuição a priori e a posteriori.
A priori :Considere um espaço amostral com n eventos elementares
<latex>\Omega=\lbrace A_{1},A_{2},\ldots,A_{n}\rbrace</latex>
caso não haja justificativas para atribuir maior probabilidade a um determinado ponto, é natural imaginar que as chances estão igualmente distribuídas nestes n eventos e, portanto:
<latex>P(A_{i})=\displaystyle \frac{1}{n}</latex>
para i=1,2,…,n.
A atribuição de probabilidades a priori é feita quando se há conhecimento sobre as características físicas do experimento, como por exemplo no lançamento da moeda e do dado. Por outro lado, se não há conhecimento sobre as chances do eventos no espaço amostral, as probabilidades são atribuídas após repetidas observações do fenômeno aleatório.
Exemplo: Ao lançar um dado e observar o resultado obtido na face superior, as características físicas do experimento nos levam a atribuir probabilidades do seguinte modo:
<latex> \Omega=\lbrace1,2,3,4,5,6\rbrace\ </latex>
<latex> P(A_{1})=P(A_{2})=P(A_{3})=P(A_{4})=P(A_{5})=P(A_{6})=\displaystyle\frac{1}{6} </latex>
e nesta situação, as probabilidades são atribuídas a priori.
A posteriori : Quando não há conhecimento a priori das probabilidades, elas podem ser atribuídas através da experimentação. Observe o exemplo abaixo:
Exemplo: Seja a inspeção de peças em um processo de fabricação e os seguintes eventos A={Peça Defeituosa} e B ={Peça Perfeita}. Após inspecionar 1000 peças, verificou-se que 350 eram defeituosas. A partir deste experimento, ao selecionar aleatóriamente uma peça, pode-se atribuir as seguintes probabilidades:
<latex>P(A)=\displaystyle\frac{350}{1000}=0,35</latex>
<latex>P(B)=\displaystyle\frac{650}{1000}=0,65</latex>
que são calculadas a posteriori, pela frequência de situações favoráveis em relação aos casos possíveis.
Regra da Adição de Probabilidades
A probabilidade da união de eventos é calculada através da regra da adição conforme a equação abaixo.
<latex>P(A \cup B)=P(A)+P(B)-P(A \cap B)</latex>
Ilustração pelo Diagrama de Venn
Probabilidade Condicional e Independência
Existem situações em que a ocorrência de um determinado evento B altera a chance de ocorrência de outro evento A. A informação da ocorrência do evento B traz um ganho de informação e a probabilidade de A pode ser “recalculada”.
A probabilidade condicional é definida conforme a equação abaixo :
<latex> P(A|B)=\displaystyle\frac{P(A\cap B)}{P(B)}~,P(B)>0</latex>
É comum a leitura da expressão acima como “probabilidade de A dado (a ocorrência) B”.
Regra do Produto de Probabilidades
<latex> P(A\cap B)=P(A|B)P(B)</latex>
Independência de Eventos
<latex> P(A|B) = P(A), ~P(B) >0 </latex>
Se a ocorrência do evento B não altera a probabilidade de ocorrência do evento A, os eventos A e B são ditos serem independentes. A partir dos resultados apresentados acima, torna-se direta a verificação de que:
<latex> P(A\cap B)=P(A)P(B)</latex>
se A e B são eventos independentes.
Exemplo: Sejam dois lançamentos consecutivos de uma moeda honesta e a observação das faces superiores. Considere os eventos A={cara no primeiro lançamento} e B={cara no segundo lançamento}. Pelas características deste experimento, o resultado do primeiro lançamento não deve causar interferência na probabilidade de ocorrência de cara no segundo lançamento. De fato A e B são independentes e, portanto:
<latex>P(A\cap B)=P(A)P(B)=\displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2}=\displaystyle \frac{1}{4}</latex>
Veja o artigo : Entendendo Probabilidades Condicionais
Na área biológica existem vários exemplos de eventos dependentes e eventos independentes. Assim, olhos claros e cabelos claros são dois eventos dependentes porque a probabilidade de uma pessoa ter olhos claros é maior se a pessoa tem cabelos claros. Já “olhos claros” e “idade avançada” são eventos independentes pois um não modifica a probabilidade do outro.
Partição do Espaço Amostral
No Cálculo de Probabilidades, um conjunto de eventos que sejam mutuamente exclusivos entre si, ou seja, não tenham interseção e cuja união gere o espaço amostral irá constituir uma partição do espaço amostral. No trivial exemplo do lançamento de um dado honesto e observação da face superior, os eventos:
<latex>A_1=\lbrace 1 \rbrace,A_2=\lbrace 2 \rbrace,A_3=\lbrace 3 \rbrace,A_4=\lbrace 4 \rbrace,A_5=\lbrace 5 \rbrace,A_6=\lbrace 6\rbrace </latex>
formam uma partição trivial do espaço amostral. Eles não tem interseção entre si, ou seja, não posso obter ao mesmo tempo 1 e 6 no lançamento de um dado, e a união entre eles reconstitui o próprio espaço amostral.
<latex>\cup_{i=1}^6 A_i=\Omega</latex>
Para o mesmo fenômeno aleatório (face superior no lançamento de um dado honesto) existem outras formas de particionar o espaço amostral. Verifique, por exemplo, os eventos :
<latex>B_1=\lbrace \text{Números Pares}\rbrace = \lbrace 2,4,6 \rbrace </latex>
<latex>B_2=\lbrace \text{Números Ímpares} \rbrace = \lbrace 1,3,5 \rbrace </latex>
também formam uma partição do espaço amostral pois :
- <latex>B_1 \cup B_2 = \Omega </latex>
- não há interseção entre eles
Caso haja conhecimento das probabilidades dos eventos que formam a partição, este fato pode auxiliar o cálculo de probabilidades de outros eventos conforme o exemplo abaixo.
Exemplo: Em um determinado banco, 20 % dos clientes pertencem à classe social A, 40 % à classe social B, 20 % à C e o restante à classe D. Portanto, Considerando os eventos: A = {pertencer a classe social A}, B={pertencer a classe social B}, C = {pertencer a classe social C} e D = {pertencer a classe social D}.: P(A)=0,20;P(B)=0,40;P(C)=0,20;P(D)=0,20 a situação de inadimplência ocorre nas classes sociais de acordo com os seguintes percentuais :
Tabela 2.1 - Inadimplência dentro das classes sociais
<latex>
\begin{tabular}{ccccc} \hline \hline
&\multicolumn{4}{c}{Classe Social}
situação & A & B & C & D
\hline
Inadimplência & 5\% & 30\% & 20\% & 60\%
Adimplência & 95\% & 70 \% & 80\% & 40\%
\hline
\end{tabular}
</latex>
As informações desta tabela correspondem à probabilidades condicionais. Condicional ao fato de que o cliente pertence a classe A, sua probabilidade de inadimplência é 0,05.
Com estes dados, qual a probabilidade de sortear um cliente inadimplente ?
Note que no exemplo acima, as classes sociais formam a partição do espaço amostral constituído pelos clientes do banco. As probabilidades de cada elemento da partição também são conhecidas, mas a probabilidade de um cliente ser inadimplente, independentemente de sua classe social, ainda não é conhecida, devendo ser calculada.
Considere o evento <latex> I </latex> = {cliente inadimplente}. O cliente inadimplente deve obrigatoriamente pertencer a uma das classes sociais e, não pode pertencer a mais do que uma. Logo, a probabilidade de <latex> I </latex> pode ser expressa como :
<latex>P(I)=P(I\cap A)+P(I\cap B)+P(I\cap C)+P(I\cap D)</latex>
Entretanto, pela definição de probabilidade condicional, podemos re-expressar a probabilidade acima como:
<latex>P(I)=P(I|A)P(A)+P(I|B)P(B)+P(I|C)P(C)+P(I|D)P(D)</latex>
As probabilidades acima são todas conhecidas pois <latex>P(I|A),P(I|B),P(I|C) ~\text{e}~ P(I|D)</latex> são probabilidades de inadimplência condicionais ao conhecimento da classe social e foram fornecidas na Tabela 2.1.
Substituindo as respectivas probabilidades, a probabilidade de inadimplência será:
<latex> P(I) =(0,05*0,2)+(0,3*0,4)+(0,2*0,2)+(0,6*0,2)=0,29 </latex>
Conforme o cálculo acima, a probabilidade de sortear um cliente e este ser inadimplente é de 29 %.
A solução do problema acima, calcular a probabilidade de sortear este cliente e este ser inadimplente, foi encontrada mediante a utilização do chamado Teorema da Probabilidade Total. Abaixo enunciamos este teorema.
Teorema da Probabilidade Total
Seja uma partição do espaço amostral <latex>\Omega</latex>:
<latex> C_1,C_2,\ldots,C_n </latex>
Para qualquer evento A pertencente a este espaço amostral, podemos escrever sua probabilidade como :
<latex> P(A)=P(A\cap C_1)+P(A \cap C_2)+\ldots+P(A \cap C_n)</latex>
e usando a definição de probabilidade condicional;
<latex> P(A)=P(A|C_1)P(C_1)+P(A|C_2)P(C_2)+\ldots+P(A|C_n)P(C_n)</latex>
Teorema de Bayes
A razão entre as probabilidades condicionais é a mesma razão entre as probabilidades incondicionais.
<latex> \displaystyle \frac{P(A|B)}{P(B|A)} = \displaystyle \frac{P(A)}{P(B)} </latex>
Este resultado é geralmente expresso como:
<latex> P(B|A) = \displaystyle \frac{P(A|B)P(B)}{P(A)} </latex>
Considere uma partição C1,C2,…,Cn do espaço amostral Ω. A probabilidade condicional de um determinado elemento desta partição pode ser escrita como:
<latex> P(C_j|A) = \displaystyle \frac{P(A|C_j)P(C_j)}{P(A|C_1)P(C_1)+P(A|C_2)P(C_2)+\ldots+P(A|C_n)P(C_n)} </latex>
que corresponde a enunciação geral do Teorema de Bayes.
Veja aplicação de probabilidade em saúde: Avaliação da qualidade de testes diagnósticos