http://dx.doi.org/10.24016/2016.v2n2.31

ARTÍCULOS ORIGINALES

 

 

Valores normativos de una escala de autoeficacia académica en estudiantes universitarios de Lima

 

Normative data of an academic self-efficacy scale in college students from Lima

 

 

Sergio Alexis Dominguez-Lara1 *

 

1 Universidad de San Martín de Porres, Lima, Perú.

* Dirección de correspondencia: Instituto de Investigación de Psicología, Universidad de San Martín de Porres, Av. Tomás Marsano 242 (5to piso), Lima 34 – Perú. Correo electrónico: sdominguezmpcs@gmail.com, sdominguezl@usmp.pe

 

Recibido: 12 de agosto de 2016.
Aceptado: 18 de octubre de 2016.

 

COMO CITARLO

Dominguez-Lara, S. (2016). Valores normativos de una escala de autoeficacia académica en estudiantes universitarios de Lima. Interacciones, 2(2), 91-98. doi: 10.24016/2016.v2n2.31

 


RESUMEN

El presente trabajo sintetiza la obtención de valores normativos (baremos) de la Escala de Autoeficacia Percibida Específica de Situaciones Académicas (EAPESA) en estudiantes universitarios de Lima. Participaron 883 estudiantes (75.5% mujeres) de edades comprendidas entre 16 y 56 años (M=22.16). El análisis factorial confirmatorio realizado indica que los datos se ajustan a la estructura unidimensional, y los coeficientes de confiabilidad utilizados (α, ω y H) presentan magnitudes elevadas. Las puntuaciones de la EAPESA no se ajustan a la normalidad, por lo que se elaboraron baremos utilizando percentiles. Se discuten los resultados y se sugieren guías para utilizar las normas.

PALABRAS CLAVE

EAPESA; autoeficacia académica; estudiantes universitarios; validez; confiabilidad; normas.


ABSTRACT

This paper synthesize the obtention of normative data of Academic Situations Specific Perceived Self-efficacy Scale (ASSPSE) from Lima. Were evaluated 883 college students (75.5% women) with aged between 16 and 56 years (M = 22.16). The confirmatory factor analysis performed shows an unidimensional structure, and reliability coefficients (α, ω y H) have high magnitude. The ASSPSE scores not has normal distribution, and the normative data were elaborated with percentiles. The results are discussed and practical guidelines are given for the use of the norms.

KEYWORDS

EAPESA; academic self-efficacy; college students; validity; reliability; norms.


 

La autoeficacia académica (AA), definida en el marco general de autoeficacia de Bandura (2001), es el conjunto de creencias que poseen las personas sobre su capacidad de organización y ejecución de acciones requeridas en el manejo y afronte de situaciones relacionadas con el ámbito académico (Dominguez, 2014a). Su estudio suscita la atención de los investigadores desde hace décadas ya que es uno de los predictores más significativos del rendimiento académico (Caprara, Vecchione, Alessandri, Gerbino & Barbaranelli, 2011; Gore, 2006; Hwang, Choi, Lee, Culver, & Hutchison, 2016; Robbins et al., 2004) y un factor protector importante frente a las demandas del entorno universitario (Chemers, Hu, & García, 2001). No obstante, cuando se presenta en niveles reducidos suele ser un problema real. Por ejemplo, las personas con baja AA manifiestan mayor ansiedad ante los exámenes (Dominguez, Villegas, Cabezas, Aravena, & De la Cruz, 2013), son más proclives a desarrollar agotamiento emocional académico (Dominguez, 2014b; Fernández-Arata, Dominguez-Lara, & Merino-Soto, en prensa), reportan una menor persistencia durante el ciclo académico (Gore, 2006; Robins et al., 2004), menos estrategias orientadas a la acción en situaciones previas al examen (Dominguez-Lara, en prensa), bajas aspiraciones académicas (Bassi,Steca, Delle-Fave, & Caprara, 2007), entre otros aspectos. Esta situación podrían traer consecuencias negativas tanto personales como académicas a corto (p.e., desaprobar un examen), mediano (p.e., repetir un curso) o largo plazo (p.e., extender la estancia en la universidad). A su vez, no podrían revertir por sí mismos esa situación dado que la AA se haya inversamente relacionada con la resiliencia académica (Cassidy, 2015), es decir, carecerían de recursos para afrontar de forma competente sus dificultades académicas. Por todo ello, es necesario considerar la AA como uno de los ejes principales de la conducta académica del estudiante, y tener en cuenta que su disminución podría afectar directamente su desempeño. Entonces, este panorama ameritaría una intervención, tanto de carácter individual como grupal. En este sentido, han sido desarrollados estudios experimentales y cuasiexperimentales usando diversas estrategias destinadas a incrementar las creencias de AA en estudiantes universitarios, evidenciando relativo éxito (Bartsch, Case, & Meerman, 2012; Bresó, Schaufeli, & Salanova, 2011; Griffin, & Griffin, 1998; Walter, Shenaar-Golan, & Greenberg, 2015). No obstante, a pesar de la rigurosidad y estructura del plan de intervención, un requisito indispensable es contar con instrumentos provean una medida válida y confiable que pueda ser usada para contrastar el rendimiento en AA antes y después de la intervención, debido a que las características métricas impactan directamente en los análisis estadísticos posteriores (Furr, 2011; Zimmerman, & Zumbo, 2015). Uno de los instrumentos que evalúa de forma breve y unidimensional la AAes la Escala de Autoeficacia Percibida Específica de Situaciones Académicas (EAPESA; Palenzuela, 1983). Desde su creación, la EAPESA ha sido objeto de diversos estudios instrumentales en países de habla hispana, incluyendo el Perú, presentando evidencias de validez respecto al contenido de los ítems, estructura interna, relación con otras variables, e indicadores de confiabilidad elevados (Dominguez, 2014a; Dominguez, Villegas, Yauri, Mattos, & Ramírez, 2012; García-Fernández, Inglés, Torregosa et al., 2010; García-Fernández, Inglés, Vicent et al., 2016). En consecuencia, debido a la robustez de sus propiedades psicométricas, su uso podría ampliarse a la identificación de estudiantes en riesgo académico, los cuales serían candidatos para un abordaje posterior debido a sus características particulares (Gore, 2006; Davidson, Feldman, & Margalit, 2012; Mercer, Nellis, Martínez, & Kirk, 2011).Sin embargo, no fueron hallados estudios que brinden valores normativos de la EAPESA para detectar de forma confiable a estudiantes con bajos niveles de AA, y de ese modo poder realizar intervenciones desde el ámbito de la tutoría para aquellos estudiantes. Por lo tanto, los objetivos de esta investigación fueron: 1) analizar la estructura interna, modelos de medición, y confiabilidad de las puntuaciones la EAPESA, 2) brindar datos normativos de la EAPESA, y 3)analizarla confiabilidad de los puntos de corte elegidos.

 

MÉTODOS

PARTICIPANTES

El tipo de muestreo utilizado en el presente estudio fue intencional. La muestra estuvo formada por 883 estudiantes universitarios (75.5% mujeres) que asisten a tres universidades privadas de Lima Metropolitana con características similares en cuanto a infraestructura, planes de estudios y años de carrera. El rango de edad estuvo entre 16 y 56 años (M = 22.16, DE = 4.93; R18-25 = 76.5%). Los estudiantes de primer a tercer ciclo formaron el grupo más numeroso (53.7%), y de cuarto a décimo ciclo, constituyen el 43.7% (2.6% no consignó el ciclo de estudio). El 72% no se encontraba laborando al momento de la evaluación. No fueron halladas encontraron diferencias significativas en cuanto a la edad entre varones y mujeres (t(881) = .874, p = .383, d = .08).

INSTRUMENTO

Escala de Autoeficacia Percibida Específica de Situaciones Académicas (EAPESA; Palenzuela, 1983). Fue usada la versión adaptada para universitarios peruanos (Dominguez, 2014a; Dominguez et al., 2012), que consiste en una medida unidimensional formada por nueve ítems con cuatro opciones de respuesta (de Nunca hasta Siempre). Las indicaciones piden responder con qué frecuencia manifiestan creencias vinculadas a su autoeficacia académica. El puntaje total se halla mediante la suma aritmética de las puntuaciones de cada ítem.

PROCEDIMIENTO

La EAPESA fue aplicada a estudiantes de psicología de tres instituciones de educación superior universitaria ubicadas en Lima Metropolitana durante los horarios de clase. Las instrucciones fueron estandarizadas y fueron explicados los objetivos de la investigación resaltando la condición de participación voluntaria. Solo fueron evaluados quienes brindaron su consentimiento verbal. Ninguna de las personas evaluadas recibió compensación económica ni beneficios académicos por su participación.

Análisis estructural
Fue evaluada la dimensionalidad de la EAPESA mediante un análisis factorial confirmatorio (AFC) fue desarrollado con el programa EQS 6.2 utilizando el método de máxima verosimilitud robusto (MV), y debido al escalamiento ordinal de los ítems (Dominguez, 2014c) se empleó la matriz de correlaciones policóricas (Lee, Poon, & Bentler, 1995). Si bien no se cumplió el supuesto de normalidad univariada, puede usarse el método de MV, a partir de las magnitudes moderadas de asimetría (g1 < 2) y curtosis (g2 < 7) que poseen los ítems (Beaducel, & Herzberg, 2006; Finney, & DiStefano, 2013).
El ajuste del modelo fue evaluado por medio de la prueba SB-χ² (Satorra, & Bentler, 1994) a fin de mitigar el efecto de la falta de normalidad de los ítems, el RMSEA (£ .05), CFI (³ .95), y el SRMR (£ .08). Finalmente, fue calculada la varianza extraída promedio (AVE), a fin de obtener evidencias de validez interna convergente (AVE > .50; Fornell, & Larcker, 1981).

Análisis de confiabilidad
De forma preliminar fue evaluado el modelo de medición tau-equivalente sobre la base del modelo congenérico (Dunn, Baguley, & Brunsden, 2014; Graham, 2006). Las variaciones en el CFI (ΔCFI < -.01; Cheung, & Rensvold, 2002), el RMSEA (ΔRMSEA > -.015; Chen, 2007), y SRMR (ΔSRMR ≥ .030; Chen, 2007) informan sobre la pertinencia de considerar como estadísticamente equivalentes las cargas factoriales de los ítems de la EAPESA. Este procedimiento fue realizado a fin de sustentar el uso del coeficiente α (Cronbach, 1951) como estimador de la confiabilidad de las puntuaciones. Adicionalmente fueron reportados sus intervalos de confianza (IC; Dominguez-Lara, 2016a) mediante el módulo ICalfa (Dominguez, & Merino, 2015).
Con respecto al análisis de la confiabilidad de la variable latente fueron empleados los coeficientes ω (McDonald, 1999) y H (Dominguez-Lara, en prensa b; Hancock, & Mueller, 2001), debido a que son más robustos ante la presencia de ítems asimétricos (Trizano-Hermosilla, & Alvarado, 2016), como los que constituyen la EAPESA.

Elaboración de baremos
Previo análisis descriptivo de las medidas de tendencia central, dispersión y de normalidad con la prueba de Shapiro y Wilk (SW, 1965; Ghasemi, & Zahediasl, 2012). Como se verá más adelante, no se cumple el supuesto de normalidad para utilizar puntajes T, por lo cual los baremos fueron elaborados utilizando percentiles (Pc). Este panorama es frecuente en el campo de las pruebas psicológicas donde la mayor parte de las puntuaciones tienden a ser asimétricos (Micceri, 1989; Norton, Cosco, Doyle, Done, & Sacker, 2013; Ho, & Yu, 2015).
Como recomienda la literatura, fueron calculados una amplia gama de Pc (5, 10, …, 90, 95, y 99; ver Glaesmer et al., 2012; Nordin, & Nordin, 2013; Vázquez, Duque, & Hervás, 2013), tomando como referencia los Pc 25 y Pc 75 para delimitar los puntos de corte de los niveles Alto (> Pc 75) y Bajo (< Pc 25) de AA; aunque existen propuestas que consideran las puntuaciones alrededor del Pc 10 como inicio del rango clínico (Moriwaki, & Kamio, 2014).
Seguido a ello, fue calculado el coeficiente K2 (Livingston, 1972) a fin de evaluar la confiabilidad de cada punto de corte para llegar a una clasificación más precisa (Dominguez-Lara, 2016b; Fernández, & Merino, 2014), y el error estándar de medida (EEM). El coeficiente K2 representa una adecuada elección en el marco de los tests referidos al criterio ya que no es influido por las características distribucionales de las puntuaciones, lo que hace viable su uso aún en ausencia de normalidad (Gempp, & Saiz, 2014).

 

RESULTADOS

Análisis descriptivo y evaluación de la dimensionalidad
Los estadísticos descriptivos mostrados en la tabla 1 indican que las respuestas tienden al polo más alto de la escala, y las magnitudes de los estadísticos de distribución son aceptables (< 2). Con respeto a la estructura interna, el ajuste del modelo unidimensional fue adecuado: SB-χ²(27) = 97.422 ( p < .001), CFI = .994, RMSEA (IC90%) = .054 (.043 - .066), SRMR = .033. Asimismo, todas las cargas factoriales fueron elevadas (λ > .70; λpromedio = .771) y estadísticamente significativas (p < .001). Finalmente, existe evidencia de validez interna convergente (AVE = .596).

 

 

Confiabilidad
Con el objetivo de evaluar el modelo tau-equivalente se restringió la igualdad de cargas factoriales tomando como base el modelo evaluado previamente. Bajo esta condición, fueron obtenidos índices de ajuste adecuados: SB-χ²(35) = 137.051 (p < .001), CFI = .992, RMSEA (IC 90%) = .057 (.047, .068), SRMR = .051. Los cambios no fueron significativos en el CFI (ΔCFI = -.002), RMSEA (ΔRMSEA = .003), y SRMR (ΔSRMR = .018), indicando entonces que se cumple la tau-equivalencia entre los ítems de la EAPESA.
El coeficiente α obtuvo una magnitud elevada (.901; IC95% .888, .913), así como el coeficiente ω (.930) y H  (.933) (Hancock, & Mueller, 2001; Merino, Navarro, & García, 2014; Ponterotto, & Charter, 2009; Ponterotto, & Ruckdeschel, 2007). Por último, el EEM hallado es de baja magnitud (1.609).

Datos normativos
La puntuación total del EAPESA no se aproxima a una distribución  normal (SW(882)= .981, p < .001). Las respuestas tienden hacia las puntuaciones más elevadas (M =  26.989; DE = 5.114),  poseen asimetría y curtosis negativas y de baja magnitud (g1 = -.119; g2 = -.557) y variabilidad (CV = .189). Los Pc figuran en la tabla 2, y teniendo en cuenta los Pc 25 y 75, aquella persona que obtenga menos de 23 puntos tendría baja AA, y quien alcance más de 31 puntos, un nivel alto de AA.

 

 

Los coeficientes K2 mostraron consistentemente puntuaciones elevadas (> .90), reduciendo su magnitud al acercarse al promedio y aumentando al alejarse de este. Es decir, la clasificación es más confiable a medida que el punto de corte se aleja del promedio (Gempp, & Saiz, 2014).

 

DISCUSIÓN

El uso de la EAPESA ha estado restringido a estudios instrumentales o empíricos, pero hasta la fecha no se había planteado la posibilidad de elaborar baremos para ser usados con fines de tamizaje en evaluaciones masivas. Por ello, los resultados del presente estudio tuvieron como objetivo principal la elaboración de datos normativos que permitan establecer un punto de corte para identificar a estudiantes universitarios con baja AA.
De forma preliminar fueron abordados otros aspectos como el análisis de modelos de medición o el uso de coeficientes de confiabilidad basados en variables latentes que no habían sido reportados en estudios previos realizados con muestras peruanas (Dominguez, 2014; Dominguez et al., 2012). Estos resultados permiten incrementar las evidencias de validez a favor del uso de la EAPESA en el ámbito universitario.
Los hallazgos suponen un avance en el marco de las políticas internas universitarias dirigidas a la mejora de los servicios educativos, y concretamente los servicios de atención y orientación al estudiante en relación a la tutoría universitaria. De esta forma, con datos normativo de la EAPESA, es factible detectar a los estudiantes con bajos niveles de AA e intervenir si es necesario.
Si bien la clasificación (alta o baja AA) es un procedimiento que podría acarrear consecuencias para el evaluado, se espera que el instrumento utilizado para ese objetivo posea las propiedades psicométricas apropiadas. En este sentido, la información conjunta de los resultados (análisis estructural, confiabilidad de las puntuaciones y de los puntos de corte) indica que las puntaciones de la EAPESA podrían ser usados de forma confiable para tomar decisiones respecto a la clasificación de un estudiante. Es preciso tener en consideración que no deben tomarse las puntuaciones de la EAPESA como único criterio, ya que es necesario que sean complementados con una entrevista personal que explore aspectos vocacionales, comportamientos potencialmente  perniciosos (p.e., procrastinación académica), actitudes hacia algunas potenciales fuentes de autoeficacia (p.e., los docentes), así como un análisis minucioso de su historial académico.
Respecto a los puntos de corte, la elección de los percentiles 25 y 75 obedece a criterios prácticos, pero esa designación debe sustentarse con criterios empíricos, es decir, elegir los puntos de corte que ayuden a maximizar la diferenciación entre estudiantes con alta y baja AA respecto a variables teóricamente relevantes (p.e., agotamiento emocional, ansiedad, depresión). Además, se deben tener precauciones con respecto a la distribución de las puntuaciones, porque si bien la asimetría no es de gran magnitud, esto se debe a que el rango de respuesta es restringido y predominan las puntuaciones elevadas. Por ejemplo, l puntuación máxima debería ser 36 y la mínima, nueve (Rango teórico = 27); pero un 92.2% de personas puntúa entre 20 y 36. A pesar de ello, es un escenario esperado cuando se evalúan características positivas de las personas, por lo que sería recomendable en futuros estudios incluir medidas de deseabilidad social.
Por otro lado, los baremos presentados poseen carácter preliminar, por lo que deben ser usados con precaución en contextos aplicados, pero pueden servir para fines de investigación, sobre todo en estudios de prevalencia. Debe mencionarse que el uso del Pc es solo para comparar a la persona con un grupo normativo, ya que no son susceptibles de operaciones aritméticas (por ejemplo, los percentiles no pueden ser usados directamente para evaluar cambios o para comparar grupos) (Martínez-Arias, 1995).
El estudio no está libre de limitaciones. Una de las más resaltantes es la proporción entre varones y mujeres (1:3). Este desbalance podría ser considerado como algo esperado al evaluar estudiantes de  una sola carrera profesional (psicología), y el impacto no sería dramático teniendo en cuenta la invarianza de medida del EAPESA respecto al sexo (Merino-Soto, & Dominguez-Lara, en revisión). Sin embargo, es ineludible mencionar que para futuros estudios se debe contar un número representativo de estudiantes de diversas carreras, así como la participación de estudiantes de universidades nacionales y otras ciudades del Perú.

 

REFERENCIA

Bandura, A. (2001). Social cognitive theory: An agentive perspective. Annual Review of Psychology, 52(1), 1–26.

Bartsch, R. A., Case, K. A., & Meerman, H. (2012). Increasing academic self-efficacy in statistics with a live vicarious experience presentation. Teaching of Psychology, 39(2), 133-136.

Bassi, M., Steca, P., Delle-Fave, A., & Caprara, G. V. (2007). Academic self-efficacy beliefs and quality of experience in learning. Journal of Youth and Adolescence, 36(3), 301-312.

Bresó, E., Schaufeli, W.B., & Salanova, M. (2011). Can a Self-efficacy-based Intervention Decrease Burnout, Increase Engagement, and Enhance Performance. A quasi-experimental study. Higher Education, 61(4), 339-355.

Caprara, G.V., Vecchione, M., Alessandri, G., Gerbino, M., & Barbaranelli, C. (2011). The contribution of personality traits and self-efficacy beliefs to academic achievement: a longitudinal study. British Journal of Educational Psychology, 81, 78 – 96.

Cassidy, S. (2015). Resilience building in students: the role of academic self-efficacy. Frontiers in Psychology, 6, 1781.

Chen, F.F. (2007). Sensitivity of goodness of fit indexes to lack of measurement invariance. Structural Equation Modeling, 14, 464 – 504.

Chemers, M.M., Hu, L.-T., & García, B.F. (2001). Academic self-efficacy and first-year college student performance and adjustment. Journal of Educational Psychology, 93(1), 55 – 64.

Cheung, G.W., & Rensvold, R. B. (2002). Evaluating goodness-of-fit indexes for testing measurement invariance. Structural Equation Modeling, 9, 233 – 255.

Cronbach L.J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16(3), 297-334.

Davidson, O.B., Feldman, D.B., & Margalit, M. (2012). A focused intervention for 1st-year college students: promoting hope, sense of coherence, and self-efficacy. The Journal of Psychology, 146(3), 333 – 352.

Dominguez-Lara, S. (en prensa). Afrontamiento ante la ansiedad pre-examen y autoeficacia académica en estudiantes de ciencias de la salud. Educación Médica.

Dominguez S. (2014a). Autoeficacia para situaciones académicas en estudiantes universitarios peruanos: un enfoque de ecuaciones estructurales. Revista de Psicología – UCSP, 4, 45-53.

Dominguez, S. (2014b). Escala de Cansancio Emocional: estructura factorial y validez de los ítems en estudiantes de una universidad privada. Avances en Psicología, 21(1), 89-97.

Dominguez, S. (2014c). ¿Matrices Policóricas/Tetracóricas o Matrices Pearson? Un estudio metodológico. Revista Argentina de Ciencias del Comportamiento, 6(1), 39-48.

Dominguez-Lara, S. (2016a). Intervalos de confianza en el reporte de la fiabilidad: un análisis necesario. Anales del Sistema Sanitario de Navarra, 39(1), 169 – 170.

Dominguez-Lara, S. (2016b). Evaluación de la confiabilidad del constructo mediante el coeficiente H: breve revisión conceptual y aplicaciones. Psychologia: Avances de la Disciplina, 10(2), 87 – 94.

Dominguez-Lara, S. (2016c). Confiabilidad de los puntos de corte en estudios empíricos. Revista Cubana de Pediatría, 88(4) Recuperado desde http://www.revpediatria.sld.cu/index.php/ped/article/view/88/75

Dominguez, S. & Merino C. (2015). ¿Por qué es importante reportar los intervalos de confianza del coeficiente alfa de Cronbach? Revista Latinoamericana de Ciencias Sociales, Niñez y Juventud, 13(2), 1326-1328.

Dominguez, S., Villegas, G., Cabezas, M., Aravena, S., & De la Cruz, M. (2013). Autoeficacia académica y ansiedad ante los exámenes en estudiantes de psicología de una universidad privada. Revista de Psicología – UCSP, 3, 13-23.

Dominguez, S., Villegas, G., Yauri, C., Mattos, E. & Ramírez, F. (2012). Propiedades psicométricas de una escala de autoeficacia para situaciones académicas en estudiantes universitarios peruanos. Revista de Psicología-UCSP, 2(1), 27-39.

Dunn, T. J., Baguley, T., & Brunsden, V. (2014). From alpha to omega: A practical solution to the pervasive problema of internal consistency estimation. British Journal of Psychology, 105(3), 399 – 412.

Fernández, M., & Merino, C. (2014). Error de medición alrededor de los puntos de corte en el MBI-GS. Liberabit, 20(2), 209-218.

Fernández-Arata, M., Dominguez-Lara, S., & Merino-Soto, C. (en prensa). Ítem único de Burnout Académico y su relación con autoeficacia académica en estudiantes universitarios. Enfermería Clínica.

Finney S. J., y DiStefano, C. (2013). Nonnormal and categorical data in structural equation modeling. In G. R. Hancock y R. O. Mueller (Eds.), Structural Equation Modeling: A second course (pp. 269- 492). Greenwich, CT: Information Age Publishing Inc.

Fornell, C., & Larcker, D.F. (1981). Evaluationg structural equation models with unobservable variables and measurement error. Journal of Marketing Research, 18(1), 39 – 50.

Furr, R.M. (2011). Scale construction and psychometrics for social and personality psychology. California: SAGE.

García-Fernández, J., Inglés, C., Torregrosa, M., Ruiz, C., Díaz, A., Pérez, E. & Martínez, M. (2010). Propiedades psicométricas de la Escala de Autoeficacia Percibida Específica de Situaciones Académicas en una muestra de estudiantes españoles de Educación Secundaria Obligatoria. European Journal of Education & Psychology, 3(1), 61-74.

García Fernández, J., Inglés, C., Vicent, M., Gonzálvez, C., Pérez, & San Martín, N. (2016). Validación de la Escala de Autoeficacia Percibida Específica de Situaciones Académicas en Chile y su Relación con las Estrategias de Aprendizaje. Revista Iberoamericana de Diagnóstico y Evaluación – e Avaliação Psicológica, 41(1), 118-131.

Gempp, R. & Saiz, J. L. (2014). El coeficiente K2 de Livingston y la fiabilidad de una decisión dicotómica en un test psicológico. Universitas Psychologica, 13(1), 217-226.

Ghasemi, A., & Zahediasl, S. (2012). Normality Tests for Statistical Analysis: A Guide for Non-Statisticians. International Journal of Endocrinology and Metabolism, 10(2), 486-489.

Glaesmer, H., Rief, W., Martin, A., Mewes, R., Brahler, E., Zenger, M., & Hinz, .A. (2012). Psychometric properties and population-based norms of the Life Orientation Test Revised (LOT-R). British Journal of Health Psychology, 17, 432–445.

Gore, P.A. (2006). Academic self-efficacy as a predictor of college outcomes: two incremental validity studies. Journal of Career Assessment, 14(1), 92 – 115.

Graham, J. M. (2006). Congeneric and essentially tau-equivalent estimates of score reliability: What they are and how to use them. Educacional and Psychological Measurement, 66, 930 – 944.

Griffin, M. M., & Griffin, B. W. (1998). An investigation of the effects of reciprocal peer tutoring on achievement, self-efficacy, and test anxiety. Contemporary Educational Psychology, 23(3), 298-311.

Hancock, G. R., & Mueller, R. O. (2001). Rethinking construct reliability within latent variable systems. In R. Cudeck, S. H. C. du Toit & D. Sörbom (Eds.), Structural equation modeling: Past and present. A Festschrift in honor of Karl G. Jöreskog (pp. 195–261). Chicago: Scientific Software International.

Ho, A. D., & Yu, C. Y. (2015). Descriptive Statistics for Modern Test Score Distributions Skewness, Kurtosis, Discreteness, and Ceiling Effects. Educational and Psychological Measurement, 75(3), 365-388.

Huang, C. (2013). Gender differences in academic self-efficacy: a meta-analysis. European Journal of Psychology of Education, 28(1), 1-35.

Hwang, M., Choi, H., Lee, A. Culver, J., & Hutchison, B. (2016). The Relationship between Self-Efficacy and Academic Achievement: A 5-Year Panel Analysis. The Asia-Pacific Education Researcher, 25(1), 89 – 98.

Lee, S.-Y., Poon, W.-Y. & Bentler, P. M. (1995). A two-stage estimation of structural equation models with continuous and polytomous variables. British Journal of Mathematical and Statistical Psychology, 48, 339–358.

Livingston, S. A. (1972). Criterion-referenced applications of classical test theory. Journal of Educational Measurement, 9(1), 13-26.

Martínez-Arias, R. (1995). Psicometría: teoría de los tests psicológicos y educativos. Madrid: Síntesis.

McDonald R.P. (1999). Test theory: A unified treatment. Mahwah, N.J.: L. Erlbaum Associates.

Mercer, S.H., Nellis, L.M., Martínez, R.S., & Kirk, M. (2011). Supporting the students most in need: academic self-efficacy and perceived teacher support in relation to within-year academic growth. Journal of School Psychology, 49, 323 – 338.

Merino C., Navarro J., & García W. (2014). Revisión de la consistencia interna del Inventario de Inteligencia Emocional de Bar-On, EQ-I: YV. Revista Peruana de Psicología y Trabajo Social, 3(1),141-154.

Micceri, T. (1989). The unicorn, the normal curve and other improbable creatures. Psychological Bulletin, 105(1), 156-166.

Moriwaki, A., & Kamio, Y. (2014). Normative data and psychometric properties of the strengths and difficulties questionnaire among Japanese school-aged children. Child and Adolescent Psychiatry and Mental Health, 8(1), 1 - 12.

Nordin, M., & Nordin, S. (2013). Psychometric evaluation and normative data of the Swedish versión of the 10-ítem perceived stress scale. Scandinavian Journal of Psychology, 54, 502 – 507.

Norton, S., Cosco, T., Doyle, F., Done, J., & Sacker, A. (2013). The Hospital Anxiety and Depression Scale: a meta confirmatory factor analysis. Journal of Psychosomatic Research, 74(1), 74-81.

Palenzuela, D. (1983). Construcción y validación de una escala de autoeficacia percibida específica de situaciones académicas. Análisis y Modificación de Conducta, 9(21), 185- 219.

Ponterotto, J.G., & Charter, R.A. (2009). Statistical extensions of Ponterotto and Ruckdeschel´s (2007) reliability matriz for estimating the adecuacy of internal consistency coefficients. Perceptual and Motor Skills,108, 878 – 886.

Ponterotto, J.G., & Ruckdeschel, D.E. (2007). An overview of coefficient alpha and a reliability matrix for estimating adequacy of internal consistency coefficients with psychological research measures. Perceptual and Motor Skills, 105, 997 – 1014.

Robbins, S. B., Lauver, K., Le, H., Davis, D., Langley, R., & Carlstrom, A. (2004). Do psychosocial and study skill factors predict college outcomes? A meta-analysis. Psychological Bulletin, 130(2), 261 – 288.

Satorra, A., & Bentler, P. M. (1994). Corrections to test statistics and standard errors in covariance structure analysis. In A. von Eye & C. C. Clogg (Eds.), Latent variables analysis: Applications for developmental research (pp. 399-419). Thousand Oaks, CA: Sage.

Shapiro, S.S. & Wilk, M.B. (1965). An Analysis of Variance Test for Normality (complete Samples). Biometrika, 52(3/4), 591-611.

Trizano-Hermosilla, I., & Alvarado, J.M. (2016). Best Alternatives to Cronbach's Alpha Reliability in Realistic Conditions: Congeneric and Asymmetrical Measurements. Frontiers in Psychology, 7, 769.

Vázquez, C., Duque, A., & Hervás, G. (2013). Satisfaction with Life Scale in a representative simple of spanish adults: validation and normative data. Spanish Journal of Psychology, 16, 1 – 15.

Walter, O., Shenaar-Golan, V., & Greenberg, Z. (2015). Effect of short-term intervention program on academic self-efficacy in higher education. Psychology, 6, 1199 – 1215.

Zimmerman, D.W., & Zumbo, B.D. (2015). Resolving the issue of how reliability is related to statistical power: adhering to mathematical definitions. Journal of Modern Applied Statistical Methods. 14(2), 9-26.