Estadística y sentido común

La interpretación de la realidad es siempre reduccionista, pero tratados con ética, los datos son la representación más esmerada de la realidad

El estadióstica y el sentido comú | iStock El estadióstica y el sentido comú | iStock

Muchos años analizando datos me permitirían defender una cosa y la contraria a la vez. Si tienes una conducta ética y no eres un malnacido, la lectura atenta y concienzuda de unas cifras fructifica en una interpretación, que puede ser errónea pero se convierte en la representación más fiel y cuidadosa de una realidad.

Nos despertamos cada mañana con guarismos diacrónicos sobre la pandemia en Barcelona y Madrid, sobre las encuestas electorales, sobre los cambios de consumo, sobre las actitudes y percepciones de las personas ante determinadas situaciones... En los últimos 20 años, los medios y las redes sociales se expresan cada vez más como la NBA: a través de indicadores de eficiencia de los jugadores, relacionados con las asistencias, los rebotes, los tapones o los pases. Frases sintéticas, cifras, números, datos... La digitalización ha retorcido algo más este proceso de transición de aquello cualitativo a aquello cuantitativo en el lenguaje, en la medida en la que obliga a simplificar los mensajes, a esquematizarlos, convirtiéndolos en ideogramas, infonomías o emoticonos. Trazos gruesos, reír o llorar. Bueno o malo. Independentista o constitucionalista. Facha o de izquierdas. Viejo o joven. Sin matices ni diversidad. Las sinopsis imponen su ley marcial. Ganan por goleada la partida hasta el punto que importa menos la exposición de las representaciones que su presentación icónica. Caricatura enfrente a elaboración. Síntesis enfrente a análisis -"sin análisis no hay síntesis", decía Hegel en La Ciencia de la lógica en 1812-.

La interpretación de la realidad es forzosamente reduccionista: el diagnóstico médico contra las largas pruebas; el sumario ejecutivo contra todo el proyecto; la crónica periodística -y el título- contra el debate parlamentario; la sentencia contra el juicio. Dos médicos diagnostican la dolencia de un paciente y pueden llegar a conclusiones contrarias. Dos investigadores, con el mismo presupuesto -de cimiento de la investigación y económico- sacan consecuencias y derivaciones opuestas. Dos periodistas escuchan las mismas palabras en una rueda de prensa y acaban titulando de forma antagónica su crónica. Dos jueces leen de manera diametralmente opuesta un mismo artículo legal. Estos médicos, investigadores, periodistas o jueces, ¿han observado mal la cuestión? ¿Han utilizado métodos de investigación o herramientas de análisis diferentes? ¿Están presionados a la hora de establecer su criterio final? Como diría Hegel, la síntesis significa un adelanto.

Manipulación

La ciencia progresa a ritmo de prueba-error. Aunque hay miles de tratados de management, por ejemplo, el grueso de la gestión de empresa se ha forjado en base a prueba-error a lo largo de prácticamente todo el siglo XX y el actual.Ocurre lo mismo con cualquier rama de la medicina, la arquitectura o la observación de las aves. Hay una pregunta, una curiosidad y el hombre o la mujer se ponen a ello y encuentran respuesta. En este sentido, la investigación se ha convertido en motor permanente del cambio, produciendo conocimientos nuevos y soluciones aplicadas. Entre los instrumentos de investigación social, destaca la encuesta, entendida como una herramienta de registro y de información de la opinión pública. En 1936, el demócrata Franklin D. Roosevelt se presentaba a la reelección. George Gallup pronosticó que ganaría las elecciones norteamericanas, como así pasó. Había utilizado una muestra reducida, pero una técnica de análisis de los datos más refinada que algunos de sus colegas que decían justamente lo contrario, que lo superaría el candidato republicano, partiendo de muestras mucho más voluminosas.

Este arte de 'torturar' las cifras hasta que confiesen lo que el investigador desea ha perseguido no solo al gremio de los estadistas, sino todos aquellos que se dedican a su traducción cotidiana

Al dos veces primer ministro inglés del siglo XIX, Benjamin Disraeli, se le adjudica una frase que ha pasado a la historia como una de las más impúdicas: "Hay tres clases de mentiras, las pequeñas mentiras, las grandes mentiras y las encuestas". Justo es decir que muy probablemente no fue él el inspirador, sino más bien el escritor Mark Twain quien la pronunció antes en Estados Unidos. El premio Nobel de Economía de 1991, Ronald Coase, todavía la hizo más gorda, diciendo: "Si torturas los datos lo suficientemente, confesarán lo que haga falta". Este arte de torturar las cifras hasta que confiesen lo que el investigador desea ha perseguido no solo el gremio de los estadistas, sino todos aquellos que se dedican a su traducción cotidiana. A veces la fama confirma la realidad.

Un trabajo honesto parte siempre de una búsqueda abierta: unas pruebas médicas exhaustivas, un documento bien planificado, una escucha atenta y desinteresada de todas las fuentes o un sumario bien armado. No se trata de intuiciones, de utilizar aquello que interesa para demostrar un parti pris o justificar una creencia. El inicio consiste, pues, en elegir una muestra ponderada, siempre lo suficientemente representativa y adecuada a aquello que se busca. Sigue haciendo uso separado de los valores absolutos y relativos, de los cruces de las datos, evitando siempre confundir la correlación con la causalidad o las comparaciones de datos no equiparables. Y acaba con una explicación coherente de los resultados con los dos puntos anteriores. Claro que mientras se hace este recorrido hay paradojas –como la de Simpson o efecto Yule-Simpson-, relacionada con el mal cruce de las variables en el análisis de los resultados de una encuesta. Pero estos errores son fácilmente evitables con la pericia del investigador y del traductor, más todavía en medio de la era digital, donde uno barrido de big data ridiculiza cualquier adulteración.

Una cosa es el derecho a interpretar las cosas desde el prisma particular de cada uno y, otra muy diferente, manipular el proceso para obtener una conclusión predeterminada

Estamos hablando de la confección de un lienzo de datos y de su interpretación, por un lado, y de su comunicación al espacio público, por el otro, en medio del entorno del reduccionismo contemporáneo. En esta reflexión, me estoy olvidando de la libertad de expresión. Está claro que no la obviamos. Una cosa es emitir opiniones del cariz que sea y otra muy diferente, producir o utilizar datos. Esta segunda actividad requiere ser humilde y honesto para ponerse ante los hechos y las opiniones de otros. Para respetar las técnicas y las máquinas. Para traducir los resultados en interpretaciones numéricas consecuentes, fácilmente entendedoras para los públicos a los que van dirigidas, sin esconder en ningún momento ni la muestra ni la aclaración de la secuencia ejecutada para obtener el resultado.

Una cosa es el derecho a interpretar las cosas desde el prisma particular de cada uno y, otra muy diferente, manipular el proceso para obtener una conclusión predeterminada. Tenemos un tertuliano, mil encuestas y un millón de tuits para cada comida, que muy a menudo comunican lo que piensa su ideario, partido o religión y no una reflexión cuidadosa de unos análisis bien estructurados. Suerte que la ciudadanía es inteligente y reacciona bajando un escalón. A veces, la observación sosegada de las cosas ofrece un cuadro muy próximo de la realidad. Estamos hablando del sentido común.

Més informació
“Datos, datos, más datos”
Un observatorio catalán para prever las epidemias con 'big data'
Hoy Destacamos
Lo más leido