CURVAS ROC

✌Hello pequeños padawans del mundo sanitario. Hoy venimos a completar la información que aventuramos en el anterior post 👀.👀

Sin grandes sorpresas, vamos a explicar las Curvas ROC (Receiver Operating Characteristic Curve).

Como se ha dicho antes, estamos hablando de pruebas de screening o detección, de forma que los datos recogidos son convertidos en un resultado dicotómico por medio de la elección de un punto de corte. ¿Os suena esta definición?

En la anterior entrada hablamos del índice de Youden para calcular el punto de corte óptimo de una prueba diagnóstica, pero este se utiliza como una medida resumen de las curvas de ROC. 

Entonces, ¿Qué son las curvas ROC? 

Estas curvas son un método gráfico para ilustrar la capacidad de un test diagnóstico de diferenciar entre dos poblaciones, generalmente la enferma de la sana. De la misma forma que el YI, estas ayudan a determinar un punto de corte y sirven para comparar y elegir una prueba diagnóstica. 


Para calcularlas se necesita conocer primero la sensibilidad y la especificidad de aquellas variables continuas en diferentes puntos de corte. En otras palabras, tendremos distintos puntos de corte, cada uno relacionado con una sensibilidad y especificidad concretas. 

Esta relación se muestra de forma gráfica, de forma que en el eje Y tenemos la sensibilidad y en el eje X tenemos (1 - E). Por tanto, el gráfico relaciona los verdaderos positivos con los falsos positivos.

Vamos a poner un ejemplo para entender mejor esto.

Hemos realizado una prueba a una muestra compuesta por 71724 personas en la que se ha medido la concentración de glucosa en sangre tras 2h horas de la ingesta de un preparado y hemos obtenido los siguientes valores:

Se sabe que de esas personas 6570 son enfermas de hiperglucemia, siendo este un síntoma clave de diabetes, y se nos pide que completemos la tabla de contingencia y calculemos los valores predictivos positivos y negativos para los posibles puntos de corte resaltados en rosa en la tabla (70, 110 y 160mg/100mL

Como ya hemos visto en capítulos anteriores el procedimiento de ello vamos a saltar a presentar los resultados, pero, si tienes cualquier duda, déjala en los comentarios 😜

70 mg/100 mL

ENFERMOS

NO ENFERMOS

VP

+

6478

59420

65898

VP+ = 9,83%

-

92

5734

5826

VP- = 98,4%

6570

65154

71724

 


110 mg/100 mL

ENFERMOS

NO ENFERMOS

VP

+

5630

10359

15989

VP+= 35,21%

-

940

54795

55735

VP-= 98,31%

6570

65154

71724

 


160 mg/100 mL

ENFERMOS

NO ENFERMOS

VP

+

3094

130

3224

VP+= 95,96%

-

3476

65024

68500

VP-= 94,92%

6570

65154

71724

 


Vamos a fijarnos en los valores predictivos positivos, que nos evidencian la capacidad que tiene la prueba de distinguir como positivos a los enfermos. En la primera concentración, 70 mg/100 mL este valor es muy bajo, por lo que sabemos y comprobamos con la tabla de contingencia que la mayoría de los casos positivos son falsos positivos y además, este grupo está formado por gran parte de los individuos estudiados, lo que nos lleva a concluir que la prueba detecta bien a los enfermos, pero no es capaz de reconocer a los sanos. 

En el caso de la concentración 110 mg/mL, VP+ mejora con respecto a la anterior concentración. Vemos que el número de positivos se reduce y disminuyen ligeramente los casos de falsos positivos como consecuencia de tener una sensibilidad más baja. Sin embargo, al haber aumentado la especificidad se ha obtenido un incremento del número de falsos negativos.

Con la última concentración vemos que los valores de VP+ y VP- son muy elevados, lo que significa que la prueba tiene una gran capacidad de diagnosticar como positivos a los individuos enfermos y de diferenciar como negativos a los no enfermos. No obstante, si nos fijamos en los falsos negativos vemos que el número es muy alto, lo cual supondría un peligro para aquellas personas que se quedan sin tratamiento al ser diagnosticadas erróneamente. 

La hiperglucemia o hiperglicemia prolongada por el tiempo puede causar complicaciones a las pacientes que pueden afectar a los ojos, riñones, nervios y corazón; y tienen como particularidad que no provoca síntomas hasta que las concentraciones de glucosa alcanzan niveles muy altos- por encima de 180/200 mg/dl. 

Por tanto,  estamos ante una enfermedad en la que el error grave es no poner en tratamiento a las personas enfermas, por lo que a priori escogeríamos la concentración de 110 mg/100 mL. Aunque eso se va a confirmar con el índice de Youden 💪😛 ¿Recordáis como se hace?

Por consiguiente, se estima que la prueba resulta más válida cuando se realiza con la concentración de 110mg/100mL.


Para saber si nuestra prueba es buena tenemos que medir el área bajo la curva, también conocida como AUC. Para ello vamos a recurrir a un programa informático llamado Geogebra que nos proporciona un valor entorno a 0.8. 
Gracias a la tabla de arriba podemos concluir que nuestra prueba diagnóstica es buena, es decir, tiene una buena capacidad de resolución. 

El siguiente paso después de saber que nuestra prueba es buena y que no hay que cambiarla o modificarla es calcular el punto de corte óptimo para esta prueba mediante el YI:  YI = S + (E -1) = S - (1-E)

Índice de Youden

70 mg/100 mL

110 mg/100 mL

160 mg/100 mL

0,074

0,698

0.469


Recordemos que entre más cerca esté el YI a 1, mejor es la prueba diagnóstica. Así, el punto de corte que debemos escoger es el de 110 mg/mL para convertir esta prueba en un una prueba dicotómica. 
 
Vamos a calcular también las razones de verosimilitud:

 

Razones de Verosimilitud

 

70 mg/100 mL

110 mg/100 mL

160 mg/100 mL

RV+

1,081

5,4

235,5

RV-

0,16

0,17

0,53


Si recordamos el criterio de selección de los RV se basa en estas características:

Valores de RV

Cambios entre la probabilidad preprueba y la postprueba

+

> 10

Grandes y mayoritariamente concluyentes

-

< 0.1

+

5.0 – 10.0

Moderados

-

0.1-0.2

+

2.0-5.0

Pequeños, pero algunas veces importantes

-

0.5-0.2

+

1-2.0

Pequeños, y rara vez importantes

-

0.5-1.0

 
A pesar de que en la concentración 160 mg/100 mL tenemos una RV+ mucho más alta que 10, vemos que en la concentración 110 mg/100 mL los valores RV entran en la segunda categoría, en la que los cambios entre la probabilidad preprueba y post-prueba son moderados. 

Este hecho sumado a que los casos de falsos negativos son menores en esta concentración hacen que esta concentración sea idónea para ser el punto de corte escogido.  

Hay que tener en cuenta que si situamos este estudio en la población española, la prevalencia de diabetes tipo 2 supondría un 13,8% y todos los valores calculados se basarían en esta probabilidad pre-prueba. Si nos vamos a otra población cuya prevalencia es mayores, obtendríamos otros valores. Esto nos afectaría en los resultados de la tabla de contingencia y de los valores predictivo. 

Principalmente lo que nos indica la prevalencia es cuántos enfermos tenemos en nuestra muestra analizada. Por lo tanto, en este caso si tenemos 6570 enfermos entre los 71724 habitantes, la prevalencia de nuestra población es 0,092, mucho más baja que en España o que en una posible población de riesgo con una probabilidad pre-prueba de 33,4%.


Comentarios