Teorema de Bayes

Por Adrián Paenza Feb 18, 2018

No basta con el resultado de un examen: hay que saber interpretarlo

Hace unos pocos días se cumplieron 46 años desde que empecé a trabajar en televisión. Lamento la auto-referencia, pero verá que tiene que ver con lo que quiero contar acá abajo. Eso sucedió el 6 de febrero de 1972, en un programa que fue el predecesor de Fútbol de Primera, en lo que era el Canal 9 en Palermo, en la calle Castex. La televisión era todavía en blanco y negro y el programa lo conducía Pepe Peña, a quien quizás usted recuerde un poco mejor si pongo que fue el padre de Fernando Peña. Justamente Fernando corría por los pasillos del canal mientras nosotros hacíamos el programa ‘en vivo’, aunque Pepe no lo traía con él todos los domingos ya que empezábamos recién a las 11 de la noche. ¿Por qué cuento todo esto? Porque en ese momento yo ya me había graduado (todavía no como doctor, sino como licenciado) en matemática y curiosamente, estaba a cargo —en ese momento— de la materia Probabilidades y Estadística. Nunca fue mi especialidad, pero la obligación de estar al frente de una materia (y usted podrá consultar a cualquier persona que conozca que se dedique a la docencia), ... decía, que la mejor manera de aprender sobre un tema, es estar obligado a comunicarlo. Muy posiblemente las primeras veces no sean las mejores, pero el tiempo sirve para descubrir que muchísimas de las dudas que uno tiene son las que tendrán los alumnos, y eso sirve para acercar al docente con el estudiante y en todo caso, aprender todos al mismo tiempo, en algo que se me ocurre que debería ser más frecuente, y que tiene que ver con lo que me gusta llamar la educación horizontal... y no ‘vertical’ como sucede (casi) siempre. Pero, para variar... ¡Me desvíe!

En aquel momento se había producido un caso (público) que tenía que ver con la interpretación de los datos que había hecho un grupo de médicos a propósito de mamografías que se habían hecho a grupos de mujeres una vez que superaban los 40 años, para tratar de descubrir si tenían (o no) cáncer de mama. Mi madre estaba muy ligada a una institución (CELAM) que se ocupaba del caso (LALCEC siempre fue la más importante), pero el aporte de muchísimas mujeres tratando de concientizar a sus pares para que fueran y se hicieran una mamografía (que ellas ofrecían en forma gratuita) era una forma de cooperar con la sociedad. Tanto ella como un par de tías mías fueron capaces de resolver problemas personales por la detección precoz, algo que es bastante más frecuente hoy, pero que no lo era 50 años atrás. Soy testigo del empuje, dedicación y pasión que pusieron para convencer a miles de mujeres para que se realizaran la mamografía, así como de la actitud de muchísimos médicos que entregaban horas de su propio trabajo —también en forma gratuita— para ayudar e impulsar “la causa”.

Pero volviendo al ejemplo particular, alrededor de esa fecha del año 1972, se había realizado un estudio cuyas conclusiones estaban equivocadas. Sobre este tema escribí varias veces y también lo conté por televisión en diversos programas de difusión de la ciencia. Lo que quiero contar acá es lo que sucedió un poco más acá en el tiempo, y que dejé registrado también en sucesivas charlas en diferentes hospitales (Británico, de Niños, Italiano y Rivadavia entre otros). Le pido que preste atención a los datos y sobre todo, le sugeriría que después de leer con cuidado el texto, advierta la importancia de que haya matemáticos (o especialistas en probabilidades y estadísticas) involucrados en la toma de decisiones que nos afectan a todos en la vida real.

Si bien en esta nota voy a hablar solamente sobre el ejemplo del cáncer de mama, lo mismo podría suceder cuando en alguno de los juegos olímpicos (por poner casos conocidos) una atleta obtuvo un resultado positivo por el supuesto uso de esteroides y fue descalificada (y le quitaron la medalla), cuando en realidad pudo demostrarse después que la ‘lectura e interpretación de esos datos’ estaba equivocada. Lo mismo sucedió con una muestra de ADN para detectar la culpabilidad de una persona acusada de haber cometido un crimen. Primero fue condenada y más tarde liberada, cuando un grupo de matemáticos (contratado por la familia de este joven) pudo demostrar que las conclusiones eran erróneas.

De todas formas yo no soy un experto (ni mucho menos), pero creo que tengo suficiente experiencia para poder alertar a quienes corresponda (o sea, a toda la población) sobre la importancia de saber interpretar ciertos datos de esta misma realidad y la necesidad de recurrir a quienes sí saben del tema. Distinto sería si no existieran, pero en el país hay múltiples personas que están en condiciones de cooperar e integrarse a equipos dentro de hospitales o sanatorios o incluso guardias médicas en donde se toman muchísimas decisiones de apuro y sin demasiado tiempo para pensar, y la misma presión que viven esos médicos puede llevarlos a cometer más errores que los que cometerían si tuvieran más tiempo de elaboración. Pero, ¿por qué tiene que ser un médico quien tome la decisión cuando un matemático o un doctor en estadística (o equivalente) estaría en mejores condiciones de hacerlo?

Como ya hice en otra oportunidad, me voy a apoyar en un texto que escribió Eliezer Yudkowsky, especialista en inteligencia artificial e investigador en las Universidades de Stanford y también en Berkeley, ambas en California (EE.UU.).

Una vez más me apresuro a enfatizar que los datos ¡son ficticios! Me sirven solamente para invitarla/o a usted, a que trate de sacar algunas conclusiones, para que después pueda confrontarlos con la verdadera solución del problema. Si me permite la comparación, me suena parecido a lo que se ve en las películas o series de televisión: “Cualquier parecido o semejanza con la realidad es pura coincidencia”. Bueno, en este caso, no es tan así. Acá voy.

El planteo

Usted es una mujer que ya cruzó la barrera de los 40 años. Supongamos que su médico de cabecera le sugiere que se haga una mamografía de rutina. Es lo que indica el protocolo. En principio, el médico le dice que solamente el 1 por ciento de mujeres de su edad tienen cáncer de mama, o sea una mujer de cada cien.

Pero le agrega otros datos que usted debe conocer. El test ¡no es infalible! ¿Qué quiere decir esto?

Cuando se habla de mamografías, se sabe que el 80% de las mujeres que tienen cáncer de mama tendrán un resultado positivo. Leído de otra manera, esto es lo mismo que decir que al test se le escapan el 20% de las mujeres que se hacen el estudio pero que sí están enfermas. Es muy importante entender esto: hay 20% de mujeres que tienen este cáncer pero la mamografía no lo detectará. Estos casos se llaman falsos negativos.

Pero también se sabe (y esto es muy importante) que 9.6% de mujeres que no tienen cáncer de mama tendrán igualmente un resultado positivo de la mamografía. Es decir, el resultado será positivo pero la mujer no tiene cáncer. A este grupo se lo conoce con el nombre de falsos positivos.

Ahora sí, con toda esta información, usted se hace el test y cuando le entregan los resultados, lee que la mamografía resulta positiva.

Pregunta: ¿cuál es la probabilidad de que usted tenga en realidad cáncer de mama?

Es decir: el test dio positivo pero eso —como escribí más arriba— no asegura que usted esté enferma con seguridad. La pregunta sería: ¿cuál es la probabilidad de que sí esté enferma? En definitiva, esto es lo único que importa, ¿no es así?

Justamente llegué a este punto porque es lo que me interesa que piense. Más abajo encontrará una respuesta, pero antes de avanzar le propongo que usted (mujer u hombre) se ponga a prueba y trate de determinar cuál es esa probabilidad. ¿Qué contestaría usted?

Mientras usted piensa, yo sigo más abajo.

Replanteo del problema

Antes de avanzar voy a plantear el mismo problema de otra forma. En lugar de porcentajes, lo voy a presentar replicando los datos en números de personas. Me explico. Cuando escribí más arriba que el 1% de la población femenina mayor de 40 años tiene cáncer de mama, es lo mismo que decir que de cada 100 mujeres de ese grupo, hay una que tiene cáncer, o que entre mil mujeres deberían aparecer 10 que estén enfermas, o 100 de 10.000. Creo que de esta forma se puede entender mejor. Sígame por acá.

Se sabe entonces que de cada 10.000 mujeres mayores de 40 años que se hacen una mamografía de rutina, hay 100 que tienen cáncer de mama.

De esas 100 (que tienen cáncer), hay 80 a las que el test les da positivo. Es decir, hay 20 que tienen cáncer pero el test les da negativo... son falsos negativos.

De las 9.900 mujeres que no tienen cáncer, hay 950 de ellas en los que el test falla y les da positivo igual. Estos casos son los que se conocen como falsos positivos. (Esto se corresponde con el 9.6% de las mujeres a las cuales el test le da positivo pero que no están enfermas.)

Ahora, si usted es una de esas 10.000 mujeres que se hicieron la mamografía y obtiene un resultado positivo, ¿cuán probable es que usted esté enferma?

Como se ve, es el mismo problema formulado de dos maneras distintas. ¿Le resulta más sencillo pensarlo así?

Veamos una forma de encontrar la respuesta. Resumo los datos en esta lista:

1) Cada diez mil mujeres[1], hay 100 que tienen cáncer.

2) Hay 9.900 mujeres (de esas 10 mil) que no tienen cáncer de mama.

3) Por otro lado, 80 de las 100 que tienen mamografía positiva, están efectivamente enfermas. Es decir, de las cien que tienen cáncer, hay veinte a las que el test les da negativo (el test falla).

4) Pero de las 9.900 mujeres que no tienen cáncer de mama, hay 950 que reciben igual un resultado positivo en la mamografía. El test falla otra vez, pero en sentido contrario.

Con estos datos, esta es la pregunta (que nos debería interesar):

Si una de esas 10 mil mujeres tiene un resultado positivo en la mamografía, ¿cuán probable es que tenga cáncer de mama?

Como usted advierte, contestar esta pregunta es lo único que importa, porque en definitiva una mujer que se hace el estudio lo hace porque quiere saber si está enferma (o no). Y un médico, que recibe el resultado positivo, tiene que saber qué contestarle a su paciente: ¿cuán probable es que esté enferma?

Ahora sí, la respuesta.

Contemos cuántas mujeres tendrán resultado positivo en la mamografía.

Sabemos que hay 80 positivos que el test detecta entre las 100 que tienen cáncer. Pero hay que agregar otros 950 resultados positivos más, que corresponden a los falsos positivos. Estas son mujeres con resultado positivo pero que ¡no tienen cáncer!

Sumando estos dos números, tenemos en total 1.030 (950+80 = 1.030) positivos.

Y ahora le pregunto yo: de estas 1.030, ¿cuántas tienen cáncer efectivamente)? Respuesta: unicamente 80. Es decir que solamente 80 de las 1.030 que dieron positivo tienen cáncer.

¿Qué probabilidad hay entonces que la persona a la que le da positivo esté verdaderamente enferma?

Resultado: 80/1.030 = 0.07767 o lo que es lo mismo, un 7.8%

Es decir, es muy importante advertir que si bien es obviamente preferible tener un resultado negativo, una vez que resulta positivo, eso no garantiza (ni mucho menos) que la mujer esté enferma de cáncer, sino que tiene menos de un 8% de posibilidades de que eso suceda.

Y es por eso que quería contar este episodio. Hay múltiples ejemplos de análisis equivocados cuando se trata de interpretar datos de este tipo. Hay formas más directas de obtener el mismo resultado, usando —por ejemplo— el teorema de Bayes, pero no creo que haga falta usarlo para poder entender la magnitud del potencial error.

Algunas reflexiones

La persona no entrenada a pensar en este tipo de situaciones, tiene la fuerte tentación de deducir que si a una mujer la mamografía le dio positiva, entonces hay un 80% de posibilidades que tenga cáncer de mama. Es muy posible que esa sea la respuesta que daría la mayoría de las personas (si hiciéramos una encuesta).

Peor aún: varios estudios hechos en Estados Unidos, Francia e Italia [2] muestran que cuando los propios médicos son los que tuvieron que contestar la pregunta, sólo respondió correctamente el 15 por ciento (¡quince por ciento!). Y uno de esos exámenes se hizo en uno de los hospitales de Harvard, nada menos. Pero hay otros posteriores que exhiben que el problema persiste aún ahora.

Lo que me propuse entonces es invitarla/o a pensar conmigo y ver cómo la matemática ayuda a resolver el problema y darle otra perspectiva.

Cuando uno se tropieza por primera vez con problemas de este tipo, tiene la tentación de reemplazar el 1% de incidencia que había en la población (el dato original) por el del 80% que se sabe que da positivo en el caso en que alguien tenga esta variedad de cáncer.

Sin embargo, esto sucede porque uno tiende a confundir las dos situaciones que siguen:

La probabilidad de que una mujer que tiene una mamografía positiva tenga cáncer de mama... ¡no es lo misma que la probabilidad de que una persona que tenga cáncer de mama tenga una mamografía positiva!

Moraleja

Obviamente, los médicos no tienen por qué ser matemáticos ni por qué saber interpretar estos datos. Para eso están los matemáticos. Pero los médicos no pueden ignorar que, si van a manejar estadísticas de este tipo, necesitan tener el conocimiento para hacerlo y sacar conclusiones. La autoridad que socialmente tienen los médicos sobre nuestras vidas los obliga a tener que esforzarse en problemas de este tipo.

De la misma forma, como escribí más arriba, hay ejemplos de atletas (por caso Mary Slaney, velocista norteamericana en los Juegos Olímpicos de 1996) que fueron suspendidos por el supuesto uso de esteroides y cuyos abogados probaron que había sido una mala lectura de la información recogida. Y también hay casos de jueces que encontraron paternidades donde no las había, o acusados y condenados por crímenes que no habían cometido. La lista es muy larga (y el espacio y mis conocimientos, muy cortos).

Con todo, el aporte más importante para poder aprovechar los resultados de tests como las mamografías lo hizo Thomas Bayes.

Thomas Bayes (1702-1761), fue un matemático y presbítero inglés, quien con el mencionado teorema (que se conoce, obviamente, como el Teorema de Bayes) dejó un legado y una alternativa para poder mejorar la calidad de interpretación de los datos que se tienen.

Lo notable de este ejemplo es que una vez que uno entendió el problema y leyó la solución, piensa: ¿cómo es posible que no se me haya ocurrido antes? Pero en el momento en que la vida de una o varias personas depende de algo tan sensible como la interpretación de los datos, es cuando uno necesita la más alta calidad de ciencia. Y a nuestro país, eso es lo que le sobra: calidad en su ciencia, a pesar de lo que hace este gobierno para destruirla.

[1] Lo escribo una vez más, pero en el texto cada vez que hablo de ‘mujeres’, estoy suponiendo que son mayores de 40 años.

[2] Behavioural Decision Theory, de E.C. Poulton (EE.UU.), Chances and Frequencies in Probabilistic Reasoning: Rejoinder to Hoffrage, Gigerenzer, Krauss and Martignon, de Vittorio Girotto (Italia) y Michel Gonzalez (Francia)

--------------------------------

Para suscribirte con $ 1000/mes al Cohete hace click aquí

Para suscribirte con $ 2500/mes al Cohete hace click aquí

Para suscribirte con $ 5000/mes al Cohete hace click aquí