9.1 Antecedentes
Los clínicos utilizan las pruebas diagnósticas para identificar la presencia o ausencia de una afección en un paciente con el fin de desarrollar un plan de tratamiento adecuado (White et al. 2011). Pueden incluir tecnologías de imagen y bioquímicas, investigación patológica y psicológica, y signos y síntomas observados durante la anamnesis y las evaluaciones clínicas (Deeks. 2001). Se desarrollan nuevas pruebas diagnósticas de manera continua, impulsadas por la demanda de mejoras en la rapidez, el costo, la facilidad de realización, la seguridad del paciente y la exactitud (White et al. 2011). En consecuencia, a menudo se dispone de varias pruebas para el diagnóstico de una afección concreta. Esto pone de relieve la importancia de que los clínicos y otros profesionales de la salud tengan acceso a evidencia de alto nivel sobre la exactitud de las pruebas diagnósticas que utilizan o están considerando utilizar. El objetivo final de las pruebas diagnósticas es que produzcan mejores resultados en áreas que son importantes para el paciente. Sin embargo, las revisiones sistemáticas que investigan si las pruebas diagnósticas mejoran los resultados son revisiones de la eficacia y deben llevarse a cabo utilizando la metodología del capítulo sobre eficacia. Los estudios primarios que investigan la exactitud de las pruebas diagnósticas se denominan estudios de exactitud de las pruebas diagnósticas (EPD), y la revisión sistemática de los mismos será el tema central de este capítulo.
Los estudios de exactitud de pruebas diagnósticas comparan una prueba diagnóstica de interés (la "prueba índice") con una prueba diagnóstica existente (la "prueba de referencia"), que se sabe que es la mejor prueba disponible actualmente para identificar con exactitud la presencia o ausencia de la afección de interés. A continuación, se comparan los resultados de ambas pruebas para evaluar la exactitud de la prueba índice. Existen dos tipos principales de estudios de EPD. El primero es el diseño de diagnóstico de casos y controles, también denominado "diseño de dos puertas". En este diseño de estudio, las personas con la enfermedad (casos) proceden de una población (es decir, un centro sanitario para personas que se sabe que padecen la enfermedad), mientras que las personas sin la enfermedad proceden de otra. Aunque este diseño da una indicación de la exactitud máxima de la prueba, los resultados generalmente darán una indicación exagerada de la exactitud de la prueba en la práctica (Leeflang et al. 2013).
El segundo diseño de estudio es transversal, e incluye a todos los pacientes sospechosos de padecer la enfermedad de interés sometidos a la prueba índice y a la prueba de referencia. Los que dan positivo en la prueba de referencia pueden considerarse los casos, mientras que los que dan negativo son los controles.
Se considera que este diseño de estudio refleja mejor la práctica real y es más probable que proporcione una estimación válida de la exactitud diagnóstica (Leeflang et al. 2013).
Las revisiones sistemáticas de la exactitud de las pruebas diagnósticas proporcionan un resumen del rendimiento de las pruebas basado en toda la evidencia disponible, evalúan la calidad de los estudios publicados y tienen en cuenta la variación de los hallazgos entre los estudios (Deeks. 2001; Leeflang et al. 2013). Las estimaciones de la exactitud de las pruebas varían con frecuencia entre los distintos estudios, a menudo debido a diferencias en la forma de definir la positividad de la prueba, el diseño del estudio, las características de los pacientes y la posición de la prueba en la vía diagnóstica (Leeflang et al. 2013). Además, los estudios de EPD tienen características de diseño únicas que requieren criterios diferentes de valoración crítica en comparación con otras fuentes de evidencia cuantitativa, e indican un par de estadísticas de resumen relacionadas ("sensibilidad y especificidad", como se discute más adelante) en lugar de una única estadística, como una odds ratio. En consecuencia, las revisiones sistemáticas de estudios de EPD requieren diferentes métodos estadísticos para la agrupación metaanalítica y diferentes enfoques para la síntesis narrativa (Leeflang et al. 2014).
La exactitud diagnóstica se representa predominantemente mediante dos medidas, la sensibilidad y la especificidad; sin embargo, a veces se utilizan otras medidas, como valores predictivos, odds-ratios, cocientes de probabilidad y curvas de resumen de las características operativas del receptor (ROC) (Leeflang et al. 2014). La sensibilidad se refiere a la probabilidad de que una persona con la afección de interés tenga un resultado positivo (también conocida como proporción de verdaderos positivos [PVP]), mientras que la especificidad es la probabilidad de que una persona sin la afección de interés tenga un resultado negativo (también conocida como proporción de verdaderos negativos [PVN]) (Leeflang et al. 2014). Cabe señalar que estas definiciones se refieren a la situación clínica, y que existen otras definiciones de sensibilidad y especificidad que se utilizan en contextos diferentes (Sackett y Haynes. 2002). La sensibilidad y la especificidad se han identificado como medidas esenciales de la exactitud diagnóstica (Leeflang et al. 2013; Leeflang et al. 2014; Habbema et al. 2009; Leeflang et al. 2013b).