O Sinal e o Ruído, de Nate Silver (resenha)

É grande a tentação de buscar respostas prontas, que nos eximam de parte da responsabilidade por nossas decisões.

“O sinal e o ruído: Por que tantas previsões falham e outras não”, de Nate Silver

Se Nate Silver fosse mesmo capaz de previsões mágicas, provavelmente ele não teria escolhido um momento melhor para lançar seu primeiro livro, The signal and the noise: Why so many predictions fail — but some don’t (que chega agora ao Brasil como O sinal e o ruído: Por que tantas previsões falham e outras não, pela Intrínseca). Sua fama foi crescente, a partir de um sistema estatístico para prever o desempenho de jogadores de beisebol e depois com o FiveThirtyEight, blog (inicialmente anônimo) dedicado à análise e previsões das primárias e eleições presidenciais americanas. Em 2008, Silver previu corretamente os resultados do colégio eleitoral em todos os estados, com exceção de Indiana. A esse sucesso seguiram-se um contrato com a Penguin para dois livros e, em 2010, a incorporação de FiveThirtyEight ao portal do The New York Times. The signal… chegou às livrarias dos EUA poucos dias antes das eleições de 2012, quando todos os olhos estavam no FiveThirtyEight. As previsões do blog não decepcionaram: permanecendo fiel a seus métodos e ignorando ruídos como uma participação desastrosa de Obama em um dos debates com Romney, Silver acertou o resultado do colégio eleitoral em todos os 50 estados e fez a alegria de sua editora, que viu as vendas da obra se multiplicarem.

Considerando o sucesso estrondoso do seu autor, este é um livro humilde. Silver está longe de ser vendedor de uma fórmula mágica; é, antes de tudo, um apaixonado por dados e previsões, ao mesmo tempo um entusiasta do uso de métodos quantitativos e do poder dos computadores e um pesquisador à moda antiga, que tenta refletir sobre seus métodos e, antes de tudo, estabelecer seus potenciais e limitações.

A preocupação fundamental do livro é tentar estabelecer em quais campos previsões baseadas em observações passadas funcionam e em quais tais métodos estão condenados a falhas, ou, pior, a legitimar teorias erradas ou incompletas e transmitir sensações de falsa segurança ou alarmismo. Cada capítulo é dedicado a um estudo de caso, todos minuciosamente pesquisados, ao mesmo tempo apresentando como Silver aborda previsões e seus métodos favoritos.

Uma das observações importantes do autor, logo na introdução, é que não necessariamente o aumento de nossa capacidade de recolher e processar informação levou a um melhor entendimento de como o mundo funciona. O desenvolvimento de computadores cada vez mais rápidos foi crucial para a melhoria de previsões meteorológicas, um dos grandes casos de sucesso do livro: os processos que levam à formação de tempestades e furacões são bem compreendidos e descritos por equações relativamente simples, e o poder de computação permitiu simulações mais rápidas e alertas mais confiáveis. Hoje é possível prever um desses eventos com acurácia e antecipação necessárias para que evacuações sejam feitas e vidas sejam poupadas. Em outros campos, porém, a possibilidade de se manipular grande quantidade de dados levou a excesso de confiança e previsões erradas por várias ordens de grandeza: esse foi o desfecho de modelos de precificação de risco em derivativos complexos, que foram um aspecto importante na profundidade da crise financeira que teve início em 2007.

A abordagem estatística preferida por Silver é a bayesiana, baseada no trabalho de probabilidades condicionais (grosso modo, o que acontece com uma hipótese se há uma mudança em alguma de suas bases) de Thomas Bayes, um ministro presbiteriano e matemático amador do início do século XVIII. O apelo do modelo de Bayes está em sua simplicidade e sua dependência de certa subjetividade: os resultados dependem em larga medida de um julgamento inicial de quem faz a previsão, seja ele baseado em hipóteses já cientificamente comprovadas ou puro feeling. Para Silver, com base na terminologia consagrada por Isaiah Berlin, “raposas”, que sabem um pouco de muitas coisas, fazem previsões melhores do que “ouriços”, que sabem muito de apenas uma coisa. “Ouriços” são tentados a confiar demais em seu conhecimento e apostar todas as fichas em só um modelo ou em uma visão limitada do mundo, enquanto “raposas” são capazes de incorporar informações de diversas fontes e sempre rever suas premissas.

A briga ideológica aqui é com os chamados “frequentistas”, que seguem uma linha criada no início do século passado pelo estatístico e biólogo britânico Ronald Aylmer Fisher. Aos frequentistas é atribuído o que os economistas Stephen Ziliak e Deidre N. McCloskey chamaram, em um livro de 2008, de “culto da significância estatística”. A incerteza frequentista está nos dados, não nas hipóteses: amostras maiores sempre vão levar a previsões teoricamente mais acuradas, o que, numa era de dados mais e mais abundantes, pode levar a previsões baseadas em premissas pouco plausíveis (ou em nenhuma premissa, com experimentos de data mining dedicados a encontrar relações entre variáveis antes que qualquer hipótese sobre o comportamento conjunto delas seja formulada) e falsas conclusões sobre o funcionamento de sistemas complexos.

Silver diz que a abordagem bayesiana é mais adequada para a aplicação do método científico: observação de um fenômeno, desenvolvimento de uma hipótese capaz de explicar esse fenômeno, formulação de uma previsão baseada nessa hipótese e teste dessa previsão. Como na equação bayesiana as hipóteses são explícitas e constituem o primeiro passo para uma previsão, fica claro desde o início no que o pesquisador está baseando suas respostas. No método frequentista, muitas vezes essas hipóteses não existem ou são soterradas no tratamento dos dados, o que por vezes pode levar à confusão de ausência de ideias pré-concebidas (e à impressão de neutralidade ante a algum fenômeno) com pesquisa baseada em nenhuma ideia ou ideias vazias.

Parte das críticas a esse livro foram para essa espécie de pregação do método bayesiano, como se ele fosse o único caminho possível para a verdade. Não enxerguei esse tom: ainda que Silver evidentemente defenda o método que usa, o livro não foi escrito para convencer seus leitores de que a estatística frequentista deve ser abandonada. Acima de tudo, creio que a mensagem central é: todos os modelos de previsão são tão bons quanto suas premissas e o que é alimentado neles (versão polida de uma conhecida heurística repetida por pesquisadores: “shit in, shit out”). Num mundo onde nunca foi tão barato e rápido analisar dados, é grande a tentação de buscar respostas prontas, que encontram respaldo na tecnologia e nos levam a, de alguma maneira, nos eximir de parte da responsabilidade por nossas decisões (é mais fácil dizer que “o modelo errou” do que admitir um conhecimento prévio precário). A verdade, porém, é que nosso entendimento do mundo anda em passo muito mais lento e menos linear do que a evolução dos computadores. No fim das contas, como no dito de Pablo Picasso, computadores apenas podem nos dar respostas – o que, aqui contrariando o grande pintor, não faz deles inúteis, apenas reforça a importância de se fazer e aplicar as perguntas corretas.

::: O sinal e o ruído :::
::: Nate Silver (trad. C. Figueiredo e A. B. Rodriguez) :::
::: Intrínseca, 2013, 544 páginas :::