7.3.6.3.1 Confusión y factores confundentes
La confusión se produce cuando otro factor distinto del factor primario de interés o que se está investigando puede influir directamente en el resultado que se está midiendo. Para ser clasificado como factor confundente, no debe ser un factor que aparezca en la vía casual entre la exposición y el resultado. El sesgo de confusión se define como "sesgo del efecto estimado de una exposición sobre un resultado debido a la presencia de causas comunes de la exposición y el resultado" (Miquel 2014) (p.55). Un factor confundente o variable de confusión es una variable que puede utilizarse para disminuir el sesgo de confusión cuando se ajusta adecuadamente (Miquel 2014) (p.55).
Los criterios para los factores confundentes son: (Rothman, Greenland et al. 2008) (p.132-134)
Un factor de confusión debe ser un factor de riesgo ajeno a la enfermedad; es decir, el factor confundente es un factor de riesgo de la enfermedad y la asociación del factor con la enfermedad surge de una vía causal distinta de la estudiada.
Un factor confundente debe estar asociado a la exposición objeto de estudio en la población fuente (la población de riesgo de la que proceden los casos).
Un factor confundente no debe verse afectado por la exposición o la enfermedad. En concreto, no puede ser un paso intermedio en la ruta causal entre la exposición y la enfermedad. (Por ejemplo, en el caso de un mayor riesgo de cáncer de pulmón debido a altos niveles de consumo de carne roja, el factor confundente podría ser el "método de cocción") (Cancer Australia 2014).
Los factores confundentes pueden controlarse en las fases de diseño y análisis en el caso de los estudios observacionales. Los dos enfoques utilizados para el control de los factores confundentes en el análisis de datos son la estratificación y la modelización estadística. En la estratificación, los participantes del estudio se dividen en estratos que son grupos diferentes basados en los niveles de la posible variable de confusión, por ejemplo la edad. Aunque se trata de un método sencillo, está limitado por el hecho de que solo se puede estratificar un número determinado de factores potenciales. Por lo tanto, no es un enfoque habitual para controlar los factores confundentes en los estudios observacionales en la fase de análisis (Kahlert, Gribsholt et al. 2017). La modelización estadística (como la regresión logística múltiple, la regresión logística condicional, la regresión de riesgos proporcionales de Cox, el análisis de regresión multivariable) se utiliza para estimar la fuerza de la relación de interés mientras se controlan todos los posibles factores confundentes (Webb y Bain 2011).