FRETE GRÁTIS para todo o Brasil em compras acima de R$ 230

Razão de verossimilhança na genética forense: por que o DNA não fala em certezas, mas em força de apoio entre hipóteses

Razão de verossimilhança na genética forense: por que o DNA não fala em certezas, mas em força de apoio entre hipóteses

Poucos temas da genética forense são tão importantes — e ao mesmo tempo tão mal compreendidos fora do campo técnico — quanto a razão de verossimilhança. Para o senso comum, o DNA costuma aparecer como uma espécie de prova absoluta, quase mágica, capaz de apontar sozinho a verdade dos fatos. Já para quem trabalha seriamente com genética forense e bancos de perfis genéticos, a realidade é bem mais rigorosa, e também mais interessante. O perfil genético não “prova” de maneira metafísica. Ele apoia hipóteses com determinada intensidade, dentro de um raciocínio probabilístico estruturado.

É justamente aí que entra a razão de verossimilhança, ou likelihood ratio (LR). Em termos simples, ela não responde diretamente à pergunta “a pessoa é a fonte, sim ou não?”. Essa não é a sua função. O que ela faz é outra coisa, muito mais precisa: compara o quão provável é observar aquele resultado genético sob uma hipótese em relação a outra. Em vez de proclamar certezas finais, a LR mede a força do achado frente a hipóteses concorrentes.

Essa mudança de enfoque é decisiva. Porque desloca a genética forense do terreno da intuição simplista para o da avaliação científica da evidência. A questão deixa de ser “isso coincidiu?” e passa a ser “esse resultado é mais esperado se a hipótese da acusação for verdadeira ou se a hipótese alternativa for verdadeira?”. A evidência genética ganha sentido justamente nesse contraste.

O ponto central: evidência não é a mesma coisa que conclusão

Uma das confusões mais comuns em genética forense é misturar o valor da evidência com a conclusão sobre o caso. São coisas diferentes.

O exame genético produz um resultado: um perfil, uma mistura, uma compatibilidade, uma exclusão, uma correspondência em banco, uma relação de parentesco possível, uma probabilidade de inclusão, um conjunto de alelos observados. Mas o significado desse resultado não nasce automaticamente dele. Ele depende da pergunta formulada, das hipóteses comparadas e do modelo estatístico adotado.

A razão de verossimilhança serve exatamente para isso: traduzir o peso da evidência genética no confronto entre hipóteses. Ela não diz, por exemplo, que “há 99,999% de chance de o suspeito ser culpado”. Esse tipo de formulação é inadequado. A culpa não é variável genética, e a LR não mede probabilidade de culpa. O que ela mede é quanto mais provável é o resultado laboratorial sob uma hipótese do que sob outra.

Essa distinção, embora pareça sutil, é uma das mais importantes de toda a genética forense. Porque impede que a prova genética seja apresentada como oráculo e obriga o raciocínio a permanecer no lugar correto: o da força de apoio da evidência.

O que é, de fato, a razão de verossimilhança

A estrutura conceitual da LR é elegante na sua simplicidade:

LR = P(Evidência | Hipótese 1) / P(Evidência | Hipótese 2)

Ou seja: pega-se a probabilidade de observar o resultado obtido se a hipótese 1 for verdadeira e divide-se pela probabilidade de observar esse mesmo resultado se a hipótese 2 for verdadeira.

Se a LR for muito maior que 1, a evidência favorece a hipótese do numerador.
Se a LR for próxima de 1, a evidência pouco discrimina entre as hipóteses.
Se a LR for menor que 1, ela favorece a hipótese do denominador.

Parece uma conta simples — e, em certo sentido, é. Mas o que a torna poderosa não é a fórmula em si. É a disciplina conceitual que ela exige. Antes de calcular qualquer coisa, é preciso definir corretamente quais hipóteses estão sendo comparadas. E isso muda tudo.

Na genética forense, a LR nunca existe no vazio. Ela é sempre a resposta a uma pergunta bem formulada.

A importância das hipóteses concorrentes

Esse ponto merece ênfase máxima: a LR depende radicalmente das hipóteses escolhidas.

Num caso de comparação direta entre vestígio e referência de um indivíduo, uma formulação possível seria:

  • H1: o DNA do vestígio veio do indivíduo de referência.
  • H2: o DNA do vestígio veio de um indivíduo desconhecido, não relacionado, da população relevante.

Já em um caso de mistura, a formulação pode ser bem mais complexa:

  • H1: a mistura contém o DNA da vítima e do suspeito.
  • H2: a mistura contém o DNA da vítima e de um indivíduo desconhecido.

Em um contexto de banco de perfis genéticos, pode haver ainda outra lógica:

  • H1: o perfil encontrado no vestígio e o perfil recuperado no banco têm a mesma origem biológica.
  • H2: a concordância observada decorre da ocorrência de um perfil coincidente em outro indivíduo da população relevante.

Perceba como o significado do número depende da pergunta. A LR não é “uma propriedade fixa do perfil”. Ela é o resultado da comparação entre cenários explicativos. O mesmo conjunto de dados pode gerar valores diferentes de LR conforme a estrutura da hipótese alternativa, a presença de mistura, o grau de parentesco possível, a subestrutura populacional considerada, o modelo estatístico empregado e a qualidade do perfil.

Em outras palavras: não existe interpretação séria de LR sem formulação séria de hipóteses.

Por que “não é coincidência” é uma frase tecnicamente interessante

Em genética forense, dizer simplesmente “não é coincidência” pode soar coloquial demais. Mas existe aí um núcleo conceitual importante. A razão de verossimilhança é justamente uma forma de mostrar que o resultado observado não deve ser lido como mero encontro casual de semelhanças, e sim como evidência cuja frequência esperada varia muito conforme a hipótese adotada.

Isso é especialmente relevante em perfis de STR, nos quais a coincidência bruta de alelos entre indivíduos não aparentados tende a ser progressivamente rara à medida que múltiplos locos informativos são considerados. Mas o ponto técnico não é ficar repetindo que “é raro”. O ponto é demonstrar, quantitativamente, quanto mais esperado é aquele padrão de concordância se a fonte for a indicada do que se for um indivíduo aleatório da população relevante.

A LR, portanto, é uma resposta contra a banalização do termo “coincidência”. Ela não elimina a possibilidade estatística abstrata de outra origem; ela mostra o peso relativo da evidência frente às hipóteses em disputa.

A aplicação no banco de perfis genéticos

Quando entramos no universo dos bancos de perfis genéticos, a discussão fica ainda mais interessante. Um match em banco tem grande impacto investigativo, mas seu valor precisa ser interpretado com rigor. O banco não “resolve” automaticamente o caso. Ele gera uma correspondência que pode orientar a investigação, mas essa correspondência precisa ser estatisticamente contextualizada.

Em termos práticos, um hit de banco é um evento informativo, mas não autossuficiente. É preciso considerar a qualidade do perfil, o número de locos comparados, a possibilidade de perfis parciais, eventuais artefatos, mistura, degradação, população de referência e o próprio contexto do banco. A LR entra como instrumento crucial para expressar a força dessa correspondência, evitando tanto a subestimação quanto a hipertrofia interpretativa.

Isso é particularmente importante porque bancos de perfis trabalham com grandes volumes de comparação. E quando o universo comparado aumenta, cresce também a necessidade de interpretar corretamente o achado estatístico. A mera existência de uma correspondência não deve ser lida fora de contexto. O papel da estatística forense, nesse cenário, é justamente impedir que a linguagem do “bateu / não bateu” substitua a análise científica da evidência.

A LR como linguagem de força probatória

Uma das maiores virtudes da razão de verossimilhança é que ela permite expressar a evidência genética em termos de força de apoio. Ela não se confunde com decisão judicial, não se confunde com autoria penal, não se confunde com prova isolada de presença num contexto jurídico mais amplo. Ainda assim, ela oferece algo extremamente valioso: uma linguagem racional para quantificar o peso do resultado laboratorial.

Isso é importante porque o laudo pericial não deve apenas informar que houve compatibilidade. Ele deve, idealmente, explicar o que essa compatibilidade significa no confronto entre hipóteses. Sem isso, corre-se o risco de apresentar um dado biologicamente correto, mas epistemologicamente pobre.

A LR ajuda a sair do binarismo. Em vez de um raciocínio grosseiro do tipo “combina / não combina”, ela permite dizer: a evidência observada é tantas vezes mais provável sob uma hipótese do que sob outra. Isso é muito mais científico, muito mais transparente e muito mais compatível com o que a genética forense realmente pode oferecer.

O perigo das leituras erradas

Justamente por ser poderosa, a LR também pode ser mal usada. Há alguns erros clássicos que precisam ser evitados.

O primeiro é confundir probabilidade da evidência sob a hipótese com probabilidade da hipótese dada a evidência. A LR não responde diretamente à segunda pergunta. Ela integra uma lógica inferencial maior, mas não deve ser convertida, sozinha, em probabilidade de culpa, inocência ou autoria.

O segundo erro é tratar o valor numérico como se falasse sozinho. Um número elevado impressiona, mas sem hipótese bem formulada, sem descrição do contexto e sem clareza sobre a população de referência, ele perde parte de seu valor interpretativo.

O terceiro erro é esquecer que o resultado genético depende também da qualidade do dado. Perfis degradados, parciais, mistos ou de baixa quantidade de DNA podem exigir modelos estatísticos mais complexos e interpretações mais cautelosas.

O quarto erro é usar a estatística como verniz de certeza. A linguagem quantitativa não elimina a necessidade de prudência. Pelo contrário: quanto mais sofisticada a análise, maior a obrigação de explicá-la corretamente.

Por que a razão de verossimilhança é tão central na genética forense

No fundo, a LR é central porque ela traduz, de maneira muito elegante, uma ideia crucial da ciência forense: a evidência tem valor relacional. Ela não vale por si só, isolada no espaço. Vale em relação a hipóteses rivais.

Essa talvez seja a contribuição mais madura da estatística forense para o raciocínio probatório. Ela nos obriga a abandonar tanto a sedução da certeza absoluta quanto o conforto da linguagem vaga. Em vez de dizer “é ele” ou “foi coincidência”, a LR ensina a formular a pergunta correta e a quantificar o apoio relativo que a evidência oferece.

Isso torna a genética forense mais exigente, mas também mais honesta. O laudo deixa de prometer onisciência e passa a oferecer exatamente aquilo que a evidência pode sustentar com rigor.

Quando um conceito técnico vira linguagem de pertencimento

Alguns conceitos permanecem confinados ao espaço especializado do laboratório e do laudo. Outros, sem perder densidade, acabam se tornando também signos de reconhecimento entre quem vive a área de forma íntima. A razão de verossimilhança está claramente entre estes.

Para geneticistas forenses, peritos criminais, profissionais ligados a bancos de perfis genéticos e estudantes que já ultrapassaram a fase mais superficial da disciplina, a LR não é apenas uma sigla. Ela representa um modo de pensar a evidência com precisão, sem cair na armadilha da coincidência mal formulada nem na ilusão da certeza ingênua.

 

É justamente daí que nasce o interesse de uma peça inspirada nessa linguagem. Quando a referência à razão de verossimilhança aparece visualmente numa estampa, o reconhecimento não vem apenas do gráfico ou da fórmula implícita, mas de tudo o que ela condensa: estatística forense, comparação de hipóteses, interpretação de evidência, rigor metodológico e a inteligência própria de quem sabe que, em genética forense, o DNA não fala em absolutos — ele pesa cenários.