Neumología. 15 Nº 4

El Modelo Bayesiano

A Asociación Colombiana de Neumología y Cirugía de Tórax

Este es relativamente sencillo en su concepción y básicamente se resume en la combinación de varias probabilidades o riesgos. La probabilidad diagnóstica en un paciente se encuentra en función tanto del riesgo basal que tiene ese individuo de padecer la enfermedad como del resultado (positivo o negativo) obtenido de una prueba dada, que tiene valores determinados de sensibilidad y especificidad para esa enfermedad.

Aquellos interesados en la derivación de la fórmula matemática del teorema, pueden consultar el anexo correspondiente de éste libro u otras fuentes4 , 5 .

Los elementos consignados en cursiva en el párrafo anterior, requieren de cierta contextualización.

La probabilidad diagnóstica, la respuesta al problema diagnóstico en medicina, es una sentencia que tiene dos lados, o dos perspectivas diferentes del mismo fenómeno, analógicamente como lo fuese un vaso con agua que puede encontrarse simultáneamente “medio lleno” y “medio vacío”.

Si una mujer tiene definitivamente una probabilidad diagnóstica de tener Cáncer de Seno del 1%, tiene simultáneamente una probabilidad diagnóstica del 99% de no tenerlo. La primera debería llamarse, en honor a su verdadero significado, probabilidad diagnóstica positiva y la segunda probabilidad diagnóstica negativa. Otras maneras más populares como son conocidas son el Valor Predictivo Positivo y el Valor Predictivo Negativo respectivamente. Figura 2.

Figura 2. Formato gráfico de la percepción del VAlor Predictivo, ya sea que se contemple la perspectiva positiva o negativa.

Es muy llamativo cómo, aunque en esencia son el mismo riesgo, pero explorado desde diferente perspectiva, los pacientes y aun nosotros mismos, interpretemos la información aportada dependiente del lado que se nos presente1 .

El riesgo basal es la probabilidad del desorden de interés antes de que el resultado de una nueva prueba diagnóstica sea conocido2 o que se haya tomado una decisión clínica derivada de dicho valor. Otros sinónimos de éste termino son probabilidad pre-prueba, probabilidad ” pre-test”, riesgo pre-prueba.

La probabilidad pre-prueba, que en propiedad es otra prueba diagnóstica, depende de lo nutrido del contexto y del escenario en que sea contemplada. Si un individuo es totalmente asintomático para alguna enfermedad, la probabilidad pre-prueba de “padecerla” (mas bien la probabilidad del diagnóstico de esa enfermedad en ese momento) es igual a la Prevalencia de la condición en la población (Prevalencia poblacional). Si este fuese el caso, Usted necesitaría establecer en la paciente del problema que le consulta, cuál es la Prevalencia poblacional de Cáncer de mama en mujeres de 45 años del país donde se encuentre, y para ello son “vitales” las estadísticas vitales de los organismos sanitarios estatales.

Note cómo la probabilidad pre-prueba en éste caso se compone de cuatro pruebas diagnóstica separadas pero relacionadas: género, edad, país, sitio y nivel de atención. Si el ejercicio fuese desarrollado en los Estados Unidos, la probabilidad pre-prueba de Cáncer de seno en ésta paciente sería del orden de 0.15% año3 (1.5 casos por cada 1000 mujeres dentro de los próximos 10 años), esto es, casi dos mujeres con cáncer de seno por cada 1000 mujeres de la misma edad y características. Esta probabilidad cambiaría en la medida que cualquiera de las cuatro variables contempladas, fuesen modificadas.

Hay naturalmente otros factores conocidos, aunque la mayoría aun no, que pueden y deben incrementar el valor de dicha probabilidad pre-prueba, que por lo tanto cumplen el criterio de ser pruebas diagnósticas y que sería menester contemplar. Como lo hemos reiterado 3,4 una Prueba Diagnóstica es cualquier dato que modifique los valores de una probabilidad de enfermedad en un individuo.

Se están construyendo afortunadamente elementos y recursos para el cálculo de probabilidades pre-prueba de las enfermedades prevalentes 4 ,5 ,6 pero el camino aun es incipiente.

Ampliando un poco más los datos de la historia clínica de nuestra paciente hispana, ella tuvo su primera menstruación a los 12 años, su primer parto de un hijo vivo a los 27 años, ni su madre ni sus hermanas han sido diagnosticadas con cáncer de seno, y no ha sido objeto de biopsias de mama.

Estos cinco datos nuevos (pruebas) deben modificar, en algún sentido, la prevalencia poblacional de 0.15% referida, y este nuevo valor es otra nueva probabilidad pos-prueba, que si no nos ayuda a tomar una decisión clínica, se convertirá nuevamente en una probabilidad pre-prueba en espera de nuevos datos.

Si utilizamos el modelo predictivo7 , desarrollado a partir de los ensayos clínicos de la Iniciativa para la Salud de la Mujer8 (Women’s Health Initiative), podríamos definir, de alguna manera sobrestimada, que nuestra paciente tiene un riesgo de Cáncer de seno durante los próximos 5 años del 0.6%, o sea 0.12% de Prevalencia anual, asumiendo un riesgo uniforme a lo largo de ese tiempo.

Pues bien, si ha estado atento, ese es el dato primo, que necesita todo cultor del método Bayesiano para iniciar sus cálculos y fue la información faltante en la introducción del caso, sin la cual no se podría haber calculado adecuadamente la probabilidad pos-prueba.

Aunque suene ilógico si esta misma mujer, hubiese consultado en primera instancia a un especialista o a una institución especializada de tercer o cuarto nivel en el tema de Cáncer de mama, la probabilidad pre-prueba en ese sitio hubiese ascendido significativamente a cerca del 10%9 , más de 80 veces. En tal situación, la mujer y su condición, tienen otras características y antecedentes que, de alguna manera, modificaron significativamente su probabilidad pre-prueba de enfermedad. De la misma manera, el centro o individuo especializado a la que acude la mujer, se convierte en una prueba diagnóstica intensamente predictiva de la condición.

En virtud de lo anterior, todo clínico en ejercicio, que desee estimar válidamente sus probabilidades diagnósticas, debería medir y conocer la probabilidad pre-prueba de las condiciones con las que suele trajinar día a día, en los diferentes escenarios donde desarrolla su labor10 .

De nuevo, cada dato, que modifique en algún sentido las probabilidades diagnósticas de enfermedad en un individuo, es una prueba diagnóstica, pero cada dato observa el fenómeno desde diferente distancia3,9. Es apenas natural, que en la medida en que el dato se encuentre observando la situación real más cerradamente, se tengan mejores capacidades para definir la verdadera situación subyacente, esto es, aumentar o disminuir mucho más las probabilidades en un momento dado.

Un dato muy fiel a la realidad, que siempre determina la presencia de la enfermedad cuando ella realmente existe, o por otro lado que no la encuentre cuando realmente no existe, generará intensas modificaciones en las probabilidades hasta los puntos en que confirmaría la presencia de enfermedad si el saliese positivo, o descartaría la misma si saliese negativo11 . Confirmar o descartar la enfermedad no es otra cosa que sobrepasar unos umbrales (unos valores en la escala de probabilidad) a partir de los cuales se está “suficientemente” seguro de la presencia o ausencia de la enfermedad12 . A partir de estos Usted no haría más pruebas y ofrecería un tratamiento o descartaría la enfermedad dado su resultado positivo o negativo respectivamente. Estos umbrales3, diagnóstico y terapéutico, serán explorados en otras secciones de este libro.

La distancia que separa cada dato de la verdadera condición, puede ser medida y establecida a través de sencillos indicadores, rotulados de manera genérica como rendimiento operativo de los datos o de las pruebas diagnósticas. Una prueba diagnóstica es mejor en la medida en que ostente una mejor combinación de su rendimiento operativo. Los indicadores del rendimiento operativo de una prueba diagnóstica, contemplados de manera muy específica en medicina desde hace más de 50 años, son la Sensibilidad y la Especificidad13 .

La sensibilidad, también conocida como proporción de verdaderos positivos, es la capacidad que tiene una prueba de detectar los verdaderamente enfermos o con la condición bajo estudio, dentro de una población. Esta capacidad es expresada en términos porcentuales con respecto a lo que, en las mismas condiciones, haría un patrón de referencia (estándar de oro). Si a una prueba diagnóstica no se le escapa ningún individuo verdaderamente enfermo, dentro de un grupo de individuos explorados, diremos que tiene una sensibilidad perfecta, equivalente a un valor de 100%.

De ésta manera, las pruebas con sensibilidad perfecta son las llamadas “tamizadoras” de las condiciones, ya que al no escapárseles ningún individuo enfermo, la presencia de un resultado negativo prácticamente descarta la enfermedad.

Como lo veremos en su momento, la verdadera utilidad de las pruebas de tamizaje, que ostentan sensibilidad total, es si ellas salen negativas por que descartan virtualmente la enfermedad.

Si a una prueba se le escapan algunas personas enfermas, comete errores por omisión, y éstos son establecidos cuantitativamente, como la cantidad que le hace falta a la sensibilidad para llegar al 100%. Esta cifra es conocida como proporción de falsos negativos o proporción de escapes al diagnóstico.

La mamografía, como tamizaje, ostenta en las “manos” más experimentadas, una sensibilidad del 87%1,2, y por lo tanto una proporción de falsos negativos del 13%, lo que significa que de 100 mujeres que tienen cáncer de seno, sólo detecta 87 mujeres y se le escapan 13.

Trece mujeres con cáncer, que se pierden al diagnóstico oportuno, de cada 100 que lo tienen, son una cifra inaceptablemente alta y hacen de la mamografía, por lo tanto, una inadecuada prueba de tamizaje. La falta de reducción significativa en las tasas de mortalidad por cáncer de seno, gracias a la implementación sistemática de programas de “tamizaje” con mamografía, ha sido demostrada de manera empírica14 y confirma de cierta manera la deficiencia técnica en éstos escenarios de la prueba.

La Especificidad es también conocida como proporción de verdaderos negativos. Es la capacidad que tiene una prueba de detectar solamente a los verdaderamente sanos o sin la condición bajo estudio, dentro de una población, y ésta capacidad es expresada en términos porcentuales con respecto a lo que, en las mismas condiciones, haría un patrón de referencia (estándar de oro). Si a una prueba diagnóstica no rotula equivocadamente a ningún sano como si estuviese enfermo, diremos que tiene una especificidad perfecta, equivalente a un valor de 100%.

Las pruebas con especificidad perfecta son las llamadas “confirmatorias”, ya que al no rotular falsa mente ningún individuo sano como si estuviese enfermo, un resultado positivo de la prueba prácticamente confirma la enfermedad.

La verdadera utilidad de las pruebas, que ostentan especificidad total, es si ellas salen positivas por que confirman enfermedad.

Si una prueba rotula individuos como enfermos cuando realmente son sanos, comete errores por exceso, y éstos pueden ser establecidos cuantitativamente, como la cantidad que le hace falta a la especificidad para llegar al 100%. Esta cifra es conocida como proporción de falsos positivos o proporción de excesos al diagnóstico.

La mamografía, ostenta paradójicamente una ligera mejor especificidad (89%) que sensibilidad (87%)1,2. La proporción de falsos positivos, por lo tanto es del 11%, lo que significa que de cada 100 mujeres sanas examinadas, la prueba asigna falsamente el diagnóstico de cáncer a 11.

Esta proporción de excesos, es la reconocida responsable de que un número importante de mujeres sanas sean objeto de futuras evaluaciones, innecesarias biopsias, ansiedad, costos y morbilidad derivada de ello15 . Se ha estimado que la realización de cuatro mamografías a una mujer, durante un período de 10 años, genera en ella un riesgo acumulado, de una mamografía falsamente positiva, cercana al 24%16 .

Para resumir, el rendimiento de una prueba diagnóstica se debate entre cuatro opciones: detectar los verdaderamente enfermos, detectar los verdaderamente sanos, escapársele verdaderos enfermos e imputarle el estar enfermos a individuos sanos. El rendimiento operativo, establece el porcentaje de cada uno de estos aciertos y errores a través de la sensibilidad, especificidad, proporción de falsos negativos y proporción de falsos positivos.

Un paréntesis se hace necesario para decir que, si bien es probable que existan pruebas que muestren simultáneamente excelentes rendimientos tanto en la sensibilidad como en la especificidad, lo usual es que alguna de ellas prime, estableciéndose una especie de relación inversamente proporcional entre ellas y modificándose los valores de los cuatro elementos de su rendimiento. A mayor sensibilidad de una prueba (y por ende menor proporción de falsos negativos) menor será su especificidad (y por lo tanto mayor su proporción de falsos positivos) y viceversa. Uno podría construir un listado separado de las pruebas más sensibles por un lado y las más específicas por el otro.

Asociación Colombiana de Neumología y Cirugía de Tórax

Revista de Neumología de la Sociedad Colombiana de Neumología y Cirugía de Tórax regida por las normas del Comité Internacional de Editores de Revistas Médicas. Incluida en el Índex Medicus Latinoamericano y su base de datos LILACS. Incluida en SIBRA y el programa SCIELO. ASONEUMOCITO es una entidad científica sin ánimo de lucro, de carácter gremial, con personería jurídica reconocida por el Ministerio de Justicia mediante Resolución No 29 del 1 de abril de 1.954, que reúne a médicos especialistas en el área de la Neumología y de la Cirugía de Tórax y utiliza como sigla la denominación Asoneumocito.