Page Comparison

Term

Término

Definition

Area under the curve

Definición

Área bajo la curva (AUC)

In a

En un análisis de curva ROC (receiver operating characteristic

(ROC

)

curve analysis, an index of the performance of a diagnostic or screening measure in relation to diagnostic accuracy, summarized in a single value that typically ranges from 0.50 (no better than random classification) to 1.0 (perfect classification) (Polit & Yang, 2016); a measure of criterion validity or responsiveness.

Ceiling effect

The effect of having scores restricted at the upper end of a score continuum which limits discrimination at the upper end of the measurement, constrains true variability and restricts the amount of upward change possible

, índice del rendimiento de una medida de diagnóstico o cribado en relación con la exactitud diagnóstica, resumido en un único valor que suele oscilar entre 0,50 (clasificación no mejor que aleatoria) y 1,0 (clasificación perfecta) (Polit y Yang, 2016); una medida de validez de criterio o capacidad de respuesta.
Efecto techo	El efecto de tener puntuaciones restringidas en el extremo superior de un continuo de puntuación que limita la discriminación en el extremo superior de la medición, restringe la verdadera variabilidad y restringe la cantidad de cambio ascendente posible (Polit & Yang, 2016);

a measure of content validity

una medida de validez de contenido.

Clinimetrics

The study of instruments where items may be major or minor; or present or absent

Clinimetría

El estudio de instrumentos en los que los ítems pueden ser mayores o menores; o estar presentes o ausentes (Gewitz et al., 2015).

Comparative fit index

Índice de ajuste comparativo (CFI)

A statistic used to evaluate the goodness of fit of a proposed model to the data (e.g. in a confirmatory factor analysis or item response theory analysis) involving the comparison of the proposed model with a null model; a value greater than 0.95 is often considered as indicative of good fit (Polit & Yang, 2016); a measure of construct validity.

Construct validity

The degree to which evidence about a measure’s scores in relation to other scores supports the inference that a construct has been appropriately represented; the degree to which a measure captures the focal construct (Polit & Yang, 2016).

Content validity

The degree to which a multi-item instrument has an appropriate set of relevant items reflecting the full content of the construct domain being measured (Polit & Yang, 2016); incorporates face validity.

Content validity index (CVI)

An index summarizing the degree to which a panel of experts agrees on an instrument’s content validity (i.e. the relevance, comprehensiveness and balance of items comprising a scale) (Polit & Yang, 2016). There are item-level and scale-level CVI.

Criterion validity

The extent to which scores on a measure are an adequate reflection of (or predictor of) a criterion (i.e. ‘gold standard’ measure

	Estadístico utilizado para evaluar la bondad del ajuste de un modelo propuesto a los datos (por ejemplo, en un análisis factorial confirmatorio o un análisis de teoría de respuesta al ítem) que implica la comparación del modelo propuesto con un modelo nulo; un valor superior a 0,95 suele considerarse indicativo de un buen ajuste (Polit y Yang, 2016); una medida de validez de constructo.
Validez de constructo	El grado en que la evidencia sobre las puntuaciones de una medida en relación con otras puntuaciones apoyan la inferencia de que un constructo se ha representado adecuadamente; el grado en que una medida capta el constructo focal (Polit y Yang, 2016).
Validez de contenido	El grado en que un instrumento de múltiples ítems tiene un conjunto adecuado de ítems relevantes que reflejan el contenido completo del dominio del constructo que se mide (Polit y Yang, 2016); incorpora la validez aparente.
Índice de validez de contenido (IVC)	Índice que resume el grado en que un panel de expertos está de acuerdo en la validez de contenido de un instrumento (es decir, la pertinencia, la exhaustividad y el equilibrio de los ítems que componen una escala) (Polit y Yang, 2016). Existen IVC a nivel de ítem y a nivel de escala.
Validez de criterio	El grado en que las puntuaciones de una medida son un reflejo adecuado de (o predictor de) un criterio (es decir, medida "patrón oro") (Polit & Yang, 2016).

Cronbach’s alpha coefficients (Coefficient alpha)

An index of internal consistency that indicates the degree to which the items on a multi-item scale are measuring the same underlying construct (Polit &

Coeficientes alfa de Cronbach (Coeficiente alfa)

Índice de consistencia interna que indica el grado en que los ítems de una escala de múltiples ítems miden el mismo constructo subyacente (Polit y Yang, 2016);

a measure of reliability

una medida de fiabilidad.

Cross cultural validity

The degree to which the items on a translated or culturally adapted scale perform adequately and equivalently, individually and in the aggregate, in relation to their performance on the original instrument; an aspect of construct validity (Polit &

Validez transcultural

Grado en que los ítems de una escala traducida o adaptada culturalmente funcionan de forma adecuada y equivalente, individualmente y en conjunto, en relación con su funcionamiento en el instrumento original; un aspecto de la validez de constructo (Polit y Yang, 2016).

Differential item functioning

Funcionamiento diferencial del ítem (DIF)

The extent to which an item functions differently for one group or culture than for another despite the groups being equivalent with respect to the underlying latent trait (Polit & Yang, 2016); a measure of cross-cultural validity.

Face validity

The extent to which an instrument looks as though it is a measure of the target construct (Polit & Yang, 2016). An aspect of content validity.

Factor analysis

A statistical procedure for disentangling complex interrelationships among items and identifying the items that ‘go together’ as a unified dimension; A measure of construct validity (Polit &

	El grado en que un ítem funciona de forma diferente para un grupo o cultura que para otro a pesar de que los grupos sean equivalentes con respecto al rasgo latente subyacente (Polit y Yang, 2016); una medida de validez transcultural.
Validez aparente	El grado en que un instrumento parece medir el constructo objetivo (Polit y Yang, 2016). Un aspecto de la validez de contenido.
Análisis factorial	Procedimiento estadístico para desentrañar interrelaciones complejas entre ítems e identificar los ítems que "van juntos" como una dimensión unificada; una medida de la validez de constructo (Polit y Yang, 2016).

Floor effect

The effect of having scores restricted at the lower end of a score continuum which limits the ability of the measure to discriminate at the lower end of the measurement, constrains true variability and limits the amount of downward change possible (Polit & Yang, 2016); a measure of content validity.

Goodness of fit index (GFI)

A statistic used to evaluate the goodness of fit of a proposed model to the data (e.g. In confirmatory factor analysis); a value greater than .90 is often considered as an adequate fit (Polit & Yang, 2016); a measure of reliability.

Internal consistency

The degree to which the subparts of a composite scale (i.e. the items) are interrelated and are all measuring the same attribute or dimension; a measure of reliability (Polit & Yang, 2016).

Inter-rater reliability

The variation between two or more raters who measure the same group of subjects.

Intra-class correlation coefficients (ICC)

Estimates the proportion of total variance in a set of scores that is attributable to true differences among the people or objects being measured (e.g. the test-retest reliability); a measure of reliability

Efecto suelo	El efecto de tener puntuaciones restringidas en el extremo inferior de un continuo de puntuación que limita la capacidad de la medida para discriminar en el extremo inferior de la medición, restringe la verdadera variabilidad y limita la cantidad de cambio descendente posible (Polit y Yang, 2016); una medida de validez de contenido.
Índice de bondad de ajuste (GFI)	Estadística utilizada para evaluar la bondad del ajuste de un modelo propuesto a los datos (por ejemplo, en el análisis factorial confirmatorio); un valor superior a 0,90 suele considerarse un ajuste adecuado (Polit y Yang, 2016); una medida de fiabilidad.
Consistencia interna	Grado en que las subpartes de una escala compuesta (es decir, los ítems) están interrelacionadas y miden todas el mismo atributo o dimensión; una medida de fiabilidad (Polit y Yang, 2016).
Fiabilidad entre evaluadores	Variación entre dos o más evaluadores que miden al mismo grupo de sujetos.
Coeficientes de correlación intraclase (ICC)	Estima la proporción de la varianza total en un conjunto de puntuaciones que es atribuible a verdaderas diferencias entre las personas u objetos que se miden (por ejemplo, la fiabilidad test-retest); una medida de fiabilidad (Polit & Yang, 2016).

Intra-rater reliability

The variation of data measured by a single rater across two or more occasions.

Kappa

A statistical index of chance-corrected agreement or consistency between two nominal (or ordinal) measurements; often used to assess interrater or intra-rater reliability (Polit &

Fiabilidad intraevaluador	La variación de los datos medidos por un único evaluador en dos o más ocasiones.
Kappa	Índice estadístico de concordancia o coherencia corregida por azar entre dos mediciones nominales (u ordinales); a menudo se utiliza para evaluar la fiabilidad interevaluador o intraevaluador (Polit y Yang, 2016).

Limits of agreement

Límites de acuerdo (LOA)

An estimate of the range of differences in two sets of scores that could be considered random measurement error, typically with 95% confidence; graphically portrayed on Bland-Altman plots

Una estimación del rango de diferencias en dos conjuntos de puntuaciones que podría considerarse error de medición aleatorio, normalmente con un 95 % de confianza; representado gráficamente en gráficos de Bland-Altman (Polit & Yang, 2016);

a measure of reliability

una medida de fiabilidad.

Measurement error

The systematic and random error of a person’s score on a measure , reflecting factors other that the construct being measured and resulting in an observed score that is different from a hypothetical true score; a measurement property within the reliability domain (Polit &

Error de medición

El error sistemático y aleatorio de la puntuación de una persona en una medida, que refleja factores distintos del constructo que se está midiendo y da lugar a una puntuación observada que es diferente de una puntuación hipotética verdadera; una propiedad de medición dentro del dominio de la fiabilidad (Polit y Yang, 2016).

Measurement properties

Instruments that incorporate psychometric or clinimetric characteristics.

Non-normed fit index

Propiedades de medición	Instrumentos que incorporan características psicométricas o clinimétricas.
Índice de ajuste no normalizado (NNFI)

Also known as

También conocido como índice de Tucker-Lewis

index

(TLI)

-see below

. Ver más abajo.

Psychometrics

The study of instruments that consist of items of equal weighting.

Reliability

The degree to which a measurement is free from measurement error; the extent to which scores for people who have not changed are the same for repeated measurements; statistically, the proportion of total variance in a set of scores that is attributable to true differences among those being measured

Psicometría	Estudio de instrumentos que constan de ítems de igual ponderación.
Fiabilidad	El grado en que una medición está libre de error de medición; la medida en que las puntuaciones de las personas que no han cambiado son las mismas para mediciones repetidas; estadísticamente, la proporción de la varianza total en un conjunto de puntuaciones que es atribuible a las verdaderas diferencias entre los que están siendo medidos (Polit & Yang, 2016).

Responsiveness

The ability of a measure to detect change over time in a construct that has changed, commensurate with the amount of change that has occurred (Polit &

Capacidad de respuesta

La capacidad de una medida para detectar cambios a lo largo del tiempo en un constructo que ha cambiado, proporcional a la cantidad de cambio que se ha producido (Polit y Yang, 2016).

Root mean square error of approximation

Sensitivity

The ability of a screening or diagnostic instrument to correctly identify a ‘case’ (i.e. to correctly diagnose a condition) (Polit & Yang, 2016); a measure of criterion validity or responsiveness.

Smallest detectable change (SDC)

An index that estimates the threshold for a ‘real’ change in scores (i.e. a change that, with 95% confidence, is beyond measurement error); the SDC is a change score that falls outside the limits of agreement on a Bland-Altman plot (Polit & Yang, 2016); a measure of reliability.

Specificity

The ability of a screening or diagnostic instrument to correctly identify non-cases for a condition (Polit & Yang, 2016); a measure of criterion validity or responsiveness.

Standard error of measurement (SEM)

An index that quantifies the amount of ‘typical’ error on a measure and indicates the precision of individual scores

Error cuadrático medio de aproximación (RMSEA)

An index used to evaluate how well a hypothesized model fits the data (e.g. in confirmatory factor analysis or item response theory modelling); an RMSEA of less than .06 is considered an indicator of adequate fit (Polit & Yang, 2016); a measure of construct validity.

Índice utilizado para evaluar lo bien que un modelo hipotético se ajusta a los datos (por ejemplo, en el análisis factorial confirmatorio o en la modelización de la teoría de respuesta al ítem); un RMSEA inferior a 0,06 se considera un indicador de ajuste adecuado (Polit y Yang, 2016); una medida de la validez de constructo.
Sensibilidad	Capacidad de un instrumento de cribado o diagnóstico para identificar correctamente un "caso" (es decir, para diagnosticar correctamente una afección) (Polit y Yang, 2016); una medida de la validez de criterio o la capacidad de respuesta.
Cambio más pequeño detectable (SDC)	Índice que estima el umbral para un cambio "real" en las puntuaciones (es decir, un cambio que, con un 95 % de confianza, está más allá del error de medición); el SDC es una puntuación de cambio que queda fuera de los límites de acuerdo en un gráfico de Bland-Altman (Polit y Yang, 2016); una medida de fiabilidad.
Especificidad	Capacidad de un instrumento de cribado o diagnóstico para identificar correctamente los no casos de una afección (Polit y Yang, 2016); una medida de validez de criterio o capacidad de respuesta.
Error estándar de medición (EEM)	Índice que cuantifica la cantidad de error "típico" en una medida e indica la precisión de las puntuaciones individuales (Polit & Yang, 2016);

a measure of reliability.

Standardized root mean square residual (SRMR)

An index used to evaluate how well a hypothesized model fits the data (e.g. In a confirmatory factor analysis); an SRMR of less than 0.08 is considered an indicator of adequate fit

una medida de fiabilidad.
Residuo cuadrático medio normalizado (SRMR)	Índice utilizado para evaluar lo bien que un modelo hipotetizado se ajusta a los datos (por ejemplo, en un análisis factorial confirmatorio); un SRMR inferior a 0,08 se considera un indicador de ajuste adecuado (Polit & Yang, 2016);

a measure of construct validity.

Structural validity

The extent to which an instrument captures the hypothesized dimensionality of the broad construct; an aspect of construct validity

una medida de validez de constructo.
Validez estructural	Medida en que un instrumento capta la dimensionalidad hipotetizada del constructo amplio; un aspecto de la validez de constructo (Polit & Yang, 2016).

Test

Fiabilidad test-retest

reliability

The variation in measurements using an instrument on the same subject under the same conditions.

Tucker-Lewis index (TLI)

Also known as non-normed fit index (NNFI). A statistic used to evaluate the goodness of fit of a proposed model to the data (e.g. In confirmatory factor analysis) involving the comparison of the proposed model with a null model; a value greater than 0.95 is often considered as indicative of a good fit (Polit & Yang, 2016); a measure of construct validity.

Validity

In a measurement context, the degree to which an instrument is measuring the construct it purports to measure (Polit &

	La variación en las mediciones utilizando un instrumento en el mismo sujeto bajo las mismas condiciones.
Índice de Tucker-Lewis (TLI)	También conocido como índice de ajuste no normalizado (NNFI). Estadística utilizada para evaluar la bondad del ajuste de un modelo propuesto a los datos (por ejemplo, en el análisis factorial confirmatorio) que implica la comparación del modelo propuesto con un modelo nulo; un valor superior a 0,95 suele considerarse indicativo de un buen ajuste (Polit y Yang, 2016); una medida de la validez de constructo.
Validez	En un contexto de medición, el grado en que un instrumento mide el constructo que pretende medir (Polit y Yang, 2016).

Version	Old Version 1	New Version Current
Changes made by	Carolyn Phillips	Carolyn Phillips
Saved on	Nov 21, 2023	Feb 26, 2024

Versions Compared

Key