http://dx.doi.org/10.24016/2021.v7.213
CARTA AL EDITOR
Algunas
consideraciones previas a la estimación de la confiabilidad de instrumentos
psicométricos
Some
considerations prior to estimating the reliability of psychometric instruments
Nicolás Alejandro
Vizioli 1
1 Universidad de
Buenos Aires, Facultad de Psicología, Buenos Aires, Argentina.
*
Correspondencia: nicovizioli@gmail.com.
Recibido: 12 de abril de 2021 | Revisado: 07 de julio de 2021 | Aceptado: 22 de septiembre
de 2021 | Publicado Online: 25 de septiembre
de 2021.
CITARLO
COMO:
Vizioli, N. (2021). Algunas
consideraciones previas a la estimación de la confiabilidad de instrumentos
psicométricos. Interacciones, 7, e213.
http://dx.doi.org/10.24016/2020.v7.213
Señor editor:
La confiabilidad es un término que tradicionalmente se ha
utilizado de dos maneras (American Educational Research Association, American Psychological Association, & National Council on Measurement in Education,
2014). En primer lugar, la
confiabilidad puede entenderse como el grado de asociación entre dos
administraciones de una prueba (Revelle et al.,
2009). En segundo lugar, en un sentido más amplio, el término hace referencia a
la consistencia de las mediciones de un instrumento. Es decir, si distintas
repeticiones de una prueba determinada permiten obtener los mismos resultados
(Muñiz, 2010). Los elevados costos y complicaciones logísticas que supondrían
la realización de dos administraciones, ha dado lugar
a la elaboración de alternativas para analizar la confiabilidad de un
instrumento a través de una sola administración (McNeish,
2018; Revelle et al., 2009).
Entre las alternativas, es preciso mencionar al coeficiente KR-20
propuesto por Kuder & Richardson (1937) para
trabajar con ítems dicotómicos, que es un antecedente del coeficiente alfa, el
más difundido históricamente (Viladrich et al.,
2017). El coeficiente alfa, propuesto
por Hoyt (1941), y popularizado por Guttman (1945) y
Cronbach (1951), posibilitó estimar de manera sencilla la confiabilidad de
instrumentos con ítems ordinales. Sin embargo, distintas investigaciones han
cuestionado su utilización (por ejemplo: McNeish,
2018; Sijtsma, 2009). Por lo que se han sugerido
otros estimadores, entre los cuales los más difundidos son los coeficientes omega (McDonald, 1999), beta (Revelle, 1979), theta (Armor,
1973), H (Hancock & Mueller, 2001) o greatest lower bound (GLB, Jackson & Agunwamba, 1977). Sin embargo, antes de seleccionar el
coeficiente mediante el cual se estimará la confiabilidad, existen 4 puntos a
tomar en cuenta.
En primer lugar, se debe considerar el nivel de medición del
instrumento en cuestión. Dado que es posible estimar la confiabilidad de
distintas maneras, para datos dicotómicos, ordinales y continuos (Elosua &
Zumbo, 2008; Gadermann et al., 2012; Viladrich et al., 2017). En caso de datos continuos, la
confiabilidad debe ser estimada a partir de matrices de correlaciones o
covarianzas de Pearson. Cuando se trabaja con datos ordinales, el cálculo debe
realizarse sobre matrices de correlaciones policóricas.
Por último, si los datos son dicotómicos, los análisis deben computarse a
través de matrices de correlaciones tetracóricas.
Dado que el tratamiento de datos ordinales o dicotómicos como si fueran
continuos puede llevar a infraestimaciones de la confiabilidad (Gadermann et al., 2012).
En segundo lugar, es preciso tener en cuenta modelo subyacente al
constructo que se desea medir. En caso de modelos unidimensionales, los
coeficientes alfa y omega total se calculan para una única dimensión (Raykov & Marcoulides, 2019; Salavei et al., 2019). Al trabajar con modelos
multidimensionales, se recomienda calcular los alfa y omega de cada dimensión (Savalei et al., 2019). En caso de que el modelo sea
bifactorial o incluya un factor de segundo orden, se ha indicado la adecuación
del cálculo del omega jerárquico (Flora, 2020). El
Coeficiente H se presente como un coeficiente complementario que puede
obtenerse tanto para modelos unidimensionales como multidimensionales
(Domínguez-Lara, 2016).
En tercer lugar, se debe tomar en cuenta la adecuación de los
datos a los modelos tau equivalente y congenérico
(Dunn et al., 2014; McNeish, 2018; Viladrich et al., 2017). El modelo tau equivalente es un
modelo restrictivo, en el cual las cargas factoriales de los reactivos son
iguales, o en el que se obtienen índices de ajuste adecuados al realizar una
evaluación del modelo, restringiendo las cargas factoriales con igualdad.
Mientras que el modelo congenérico permite que los
valores de las cargas factoriales varíen libremente. La tau equivalencia es un
requisito para el cálculo del coeficiente alfa, mientras que en casos de
adecuación del modelo congenérico se indican el
coeficiente omega (Dunn et al., 2014; McNeish, 2018; Viladrich et al., 2017) y el coeficiente H (Domínguez-Lara,
2016). Puede evaluarse el ajuste a los modelos tau equivalente y congenérico a través de análisis factoriales
confirmatorios, comparando los índices de ajuste obtenidos a partir de la
restricción de cargas factoriales con los resultantes, permitiendo la variación
libre de las cargas factoriales.
En cuarto lugar, se debe considerar la presencia o ausencia de
errores correlacionados. Ya que su ausencia es requisito para el cálculo de los
coeficientes alfa y omega (McNeish, 2018; Raykov, 1998). Es preciso mencionar que se han propuesto
fórmulas que permiten corregir los coeficientes ante la presencia de errores
correlacionados (Dominguez-Lara & Merino-Soto,
2017).
En conclusión, es preciso que, al publicarse estudios que examinen
las propiedades psicométricas de un instrumento, los investigadores tomen en
consideración los 4 puntos señalados anteriormente, para decidir el modo de
análisis de la confiabilidad. A su vez, los revisores de artículos pueden
solicitar las aclaraciones pertinentes con la finalidad de mejorar la calidad
de las publicaciones.
Para finalizar, es preciso mencionar que no existe un coeficiente
perfecto de confiablidad, dado que todos tienen limitaciones. Por ejemplo, los
coeficientes alfa y omega comparten la característica de que la adición de
reactivos podría provocar aumentos espurios en los resultados obtenidos (Hair et al., 2014). Debido al aumento espurio de los
valores del coeficiente, en la práctica los valores del coeficiente omega
suelen ser mayores a los de alfa (Deng & Chang, 2017; Revelle
& Zinbarg, 2009). Por lo que se recomienda
reportar más de un coeficiente que permita dar cuenta de la confiabilidad de
las puntuaciones de un instrumento. Dado que permitiría que los lectores
tuvieran mayor información, y que se superaran posibles dificultades en la
interpretación de la confiabilidad, como resultado de las limitaciones de cada
coeficiente.
ORCID
Nicolás Alejandro Vizioli: https://orcid.org/0000-0002-6113-6847
CONTRIBUCIÓN DE LOS AUTORES
Nicolás Alejandro Vizioli: Conceptualización, validación,
investigación, escritura – borrador original, escritura-revisión, aprobación de
la versión final.
FUENTE
DE FINANCIAMIENTO
Investigación autofinanciada. Esta investigación
no recibió ninguna subvención específica de agencias de financiamiento en los
sectores público, comercial o sin fines de lucro.
CONFLICTO
DE INTERESES
El autor declara que no existe conflicto
de interés.
AGRADECIMIENTOS
No
aplica
PROCESO DE REVISIÓN
Este
estudio ha sido revisado por pares externos en modalidad de doble ciego. El
editor encargado fue Anthony Copez-Lonzoy. Se adjunta los comentarios de los pares y
respuesta de los autores como material suplementario 1.
DECLARACIÓN DE DISPONIBILIDAD DE
DATOS
No aplica.
DESCARGO DE RESPONSABILIDAD
Los autores
son responsables de todas las afirmaciones realizadas en este artículo.
REFERENCIAS
American Educational Research Association,
American Psychological Association, & National Council on Measurement in
Education (2014). Standards for
educational and psychological testing. American Educational Research
Association.
Armor, D. J. (1973). Theta reliability and
factor scaling. Sociological methodology,
5, 17-50. https://doi.org/10.2307/270831
Cronbach, L. J. (1951). Coefficient alpha
and the internal structure of tests. Psychometrika,
16(3), 297-334. https://doi.org/10.1007/BF02310555
Deng, L., & Chan, W. (2017). Testing
the difference between reliability coefficients alpha and omega. Educational and psychological measurement,
77(2), 185-203. https://doi.org/10.1177%2F0013164416658325
Domínguez-Lara, S. A. (2016). Evaluación de la confiabilidad del
constructo mediante el Coeficiente H: breve revisión conceptual y aplicaciones.
Psychologia. Avances de la disciplina, 10(2),
87-94. https://doi.org/10.21500/19002386.2134
Dominguez-Lara, S. A., & Merino-Soto, C.
(2017). Una modificación del coeficiente alfa de Cronbach por errores
correlacionados. Revista médica de Chile,
145(2), 270-271.
Dunn, T. J., Baguley, T.,
& Brunsden, V. (2014). From alpha to omega: A practical solution to the
pervasive problem of internal consistency estimation. British journal of psychology, 105(3), 399-412.
https://doi.org/10.1111/bjop.12046
Elosua, P.
& Zumbo,
B. (2008). Coeficientes de fiabilidad para escalas de
respuesta categórica ordenada. Psicothema, 20(4), 896-901.
Flora, D. B. (2020). Your coefficient
alpha is probably wrong, but which coefficient omega is right? A tutorial on
using R to obtain better reliability estimates. Advances in Methods and Practices in Psychological Science, 3(4),
484-501. https://doi.org/10.1177%2F2515245920951747
Gadermann, A. M., Guhn,
M., & Zumbo, B. D. (2012). Estimating ordinal
reliability for Likert-type and ordinal item response data: A conceptual,
empirical, and practical guide. Practical
Assessment, Research, and Evaluation, 17(1), 3.
Guttman, L. (1945). A basis for analyzing
test-retest reliability. Psychometrika,
10(4), 255-282. https://doi.org/10.1007/BF02288892
Hair, J. F., Black, W. C., Babin, B. J. & Anderson, R. E. (2014). Multivariate data analysis, Seventh Edition.
Pearson Education Limited Harlow.
Hancock, G. R., & Mueller, R. O.
(2001). Rethinking construct reliability within latent variable systems. En R. Cudeck, S. du Toit, &
D. Soerbom (Eds.), Structural equation modeling: Present and future—A festschrift in honor
of Karl Jöreskog (pp. 195-216). Scientific
Software International.
Hoyt, C. (1941). Test reliability
estimated by analysis of variance. Psychometrika,
6(3), 153-160. https://doi.org/10.1007/BF02289270
Jackson, P. H., & Agunwamba,
C. C. (1977). Lower bounds for the reliability of the total score on a test
composed of non-homogeneous items: I: Algebraic lower bounds. Psychometrika, 42(4), 567-578.
https://doi.org/10.1007/BF02295979
Kuder, G. F., & Richardson M. W.
(1937). The theory of the estimation of test reliability. Psychometrika, 2(3),
151-160. https://doi.org/10.1007/BF02288391
McNeish, D. (2018). Thanks coefficient alpha,
we’ll take it from here. Psychological methods, 23(3), 412. https://doi.org/10.1037/met0000144
Muñiz, J. (2010). Las teorías de los tests: teoría clásica y teoría de respuesta a los ítems. Papeles del Psicólogo, 31(1), 57-66.
Raykov, T., & Marcoulides,
G. A. (2019). Thanks coefficient alpha, we still need you!.
Educational and psychological
measurement, 79(1), 200-210. https://doi.org/10.1177%2F0013164417725127
Revelle, W. (1979). Hierarchical cluster analysis
and the internal structure of tests. Multivariate
Behavioral Research, 14(1), 57-74.
https://doi.org/10.1207/s15327906mbr1401_4
Revelle, W., & Zinbarg,
R. E. (2009). Coefficients alpha, beta, omega, and the GLB: Comments on Sijtsma. Psychometrika, 74(1), 145-154.
https://doi.org/10.1007/s11336-008-9102-z
Savalei, V., Reise, S.
P., Vazire, S., & Fried, E. (2019). Don’t Forget
the Model in Your Model-based Reliability Coefficients: A Reply to McNeish (2018). Collabra:
Psychology, 5(1). https://doi.org/10.1525/collabra.247
Sijtsma, K. (2009). On the use, the misuse, and
the very limited usefulness of Cronbach’s alpha. Psychometrika, 74(1), 107.
Viladrich, C., Angulo-Brunet, A., & Doval, E. (2017). Un viaje alrededor de alfa y omega para
estimar la fiabilidad de consistencia interna. Anales de Psicología, 33(3), 755-782.