Bayesianismo e ausência de informação

3
3224
Créditos da Imagem: National Science Foundation.

Por Julio Lemos

Qual a probabilidade de que

(A) Glúons existem?

Depende do ano em que vivemos. Qual a probabilidade de A em 1817? Bem, não havia basicamente nenhum indício para a existência de glúons. Essa distribuição de probabilidade mudou bastante no século XX; particularmente em 1979, quando, com a descoberta de “planar events”, já é possível dizer que a existência dessas partículas é um fato.

É mesmo o caso que

(B) ausência de indício é indício de ausência?

(Poderíamos aqui usar, de modo intercambiável, o vocábulo “prova”, no sentido de forte indício; especialmente porque o contexto não permite confusão com prova matemática.)

Bem, não, caro colega bayesiano; não na ausência de informação contextual. E você talvez o saiba (talvez após conversar com um frequentista…)

De acordo com a interpretação bayesiana da estatística—não de acordo com o Teorema de Bayes, é claro, pois ele é apenas um resultado que se segue imediatamente da definição na teoria da probabilidade, graças ao trabalho de Laplace e outros—, sim, B sempre é o caso. Por exemplo, dada a completa ausência de indício de que A em 1817, deveríamos ter concluído que A não é o caso.

Tudo se resume a uma estimativa, a saber: a probabilidade de que B é o caso em um dado contexto. A “estatística bayesiana” é incapaz de dar conta da (modelar a) ignorância [*]. Devemos, assim, estimar a probabilidade de que B é o caso antes que possamos inferir proposições como A fazendo uso dos indícios disponíveis.

A probabilidade de B aumenta com o acúmulo de conhecimento sobre as proposições de que B depende—o conjunto de eventos que contextualiza B—, e que podem ser objeto de inferência. (O tópico da ‘atribuição de probabilidade a atribuições de probabilidade’ é ainda um problema aberto [**].)

Um exemplo diverso aparentemente esclareceria essa questão. Este recua a Carl Sagan, mas alguns dos seus detalhes (e propósito) não importam. Imagine que alguém alegue que há um dragão em sua garagem, mas que ele é invisível, inaudível, etc. Ou seja, não há qualquer indício de que esse dragão exista. Pois, dirá o leitor, dado que temos um bom mapa da biodiversidade no planeta Terra, podemos estimar como sendo de 0.999 a probabilidade de que B é o caso com respeito à proposição em questão; e assim, baseados no princípio proposto acima, imediatamente somos habilitados a inferir que não é o caso que há um dragão na dita garagem—sem que seja necessário proceder a uma inspeção do local.

Mas não; esse exemplo não é adequado! Dado qualquer estado do nosso conhecimento sobre dragões, não ver, não ouvir um dragão (ou qualquer criatura afora os presentes) em um espaço confinado é sempre um forte indício para a inexistência do dragão. O Teorema de Bayes dá conta da situação perfeitamente. O exemplo é pensado—poderia ser pensado—, por meio de premissas ocultas (e respectiva distribuição de probabilidade implícita), para que B seja o caso.

Agora imagine que a alegação é de que a pessoa na verdade viu um dragão voando, digamos, sobre Atenas. Infelizmente, todavia, não temos nenhuma outra prova para a alegação de que

(C) existe ao menos um dragão.

Mas hoje, dado nosso conhecimento sobre biologia, a onipresença de celulares com câmeras etc, sabemos que P(B), a probabilidade de que B, é próxima a 1 com respeito a C. Seja t o dia de hoje. Então, digamos, P_t(B) = 0.999. Mas se estivermos vivendo em um tempo em que dragões são ainda um problema aberto, assim como glúons (ou qualquer partícula similar sem nome) o eram antes dos anos 1970, não podemos ter certeza. O resultado então é que

(D) Com respeito a C, P_s(B) < P_t(B), dados s = 500 a.C. e t = hoje.

Ou seja, a probabilidade de B com respeito a C em um cenário em que a biologia foi quase que inteiramente mapeada é maior que a probabilidade de que B com respeito a C em um cenário em que ela sequer passou pelo escrutínio de Aristóteles. Repare que, no primeiro caso, sim, a ausência de indício é indício de ausência: a ausência de fotografias (quando disponíveis) causam um descréscimo na probabilidade da existência do dragão; a existência de dragões predizem a existência de fotografias, como Laplace, e o próprio Bayes nos seus escritos ainda crus, nos acostumou a perceber. Mas a ausência de fotografias em um tempo anterior à invenção da fotografia não permite, obviamente, tal conclusão: existe uma mudança de contexto de que B, por si só, não dá conta, e não estamos autorizados a concluir simplesmente que C não é o caso. Num mundo possível em que a ignorância prevalece (basta lembrar que qualquer distribuição de probabilidade, especialmente na interpretação bayesiana da estatística, é uma estimativa relativa ao sujeito observador, e não uma propriedade dos eventos), é impossível lidar com a distribuição a priori e, assim, aplicar de modo racional o Teorema de Bayes. O caso dos glúons é similar, mas bem mais sutil; na verdade, o princípio que discutimos aqui—que B deve ser, ele mesmo, objeto de uma distribuição de probabilidades—é uma generalização de um número possivelmente infinito de casos contextuais.

[*] Cf. B. Efron (1978), “Controversies in the Foundations of Statistics”.

[**] Existe algum trabalho a fazer a respeito da probabilidade condicional, eventos simultâneos, eventos incompatíveis, etc. Acredito que parte dele tenha sido feito.

CONTINUAR LENDO