Es crucial conocer las puntuaciones y propiedades psicométricas de un instrumento de evaluación psicológica al seleccionarlo, ya que estas cualidades son fundamentales en su desarrollo, adaptación y aplicación.
Interpretación de las puntuaciones en los test psicológicos
Cuando alguien realiza un test, el evaluador recibe una puntuación directa o bruta (PD). Esta es simplemente un número que refleja el desempeño del individuo según las instrucciones del manual, pero no tiene significado intrínseco. Por ejemplo, una alta PD puede ser buena en un test de aptitud pero negativa en uno psicopatológico.
En test como el BAS-II, que utiliza la Teoría de Respuesta al Ítem, además de la puntuación directa (PD), se incluyen las Puntuaciones de Aptitud (PA). Dado que las PD no son directamente comparables entre sí, se transforman en PA para representar el rendimiento real en el test basándose en la dificultad de los ítems y las respuestas correctas. Estas puntuaciones no son normativas y solo establecen una escala común de rendimiento basada en los ítems aplicados.
Para interpretar estas puntuaciones, es necesario compararlas con los contenidos del test o con el rendimiento de otros en un grupo normativo. Los tests se basan en criterios de rendimiento (para Test Referidos al Criterio) y en baremos (para Test Referidos a la Norma) para dar significado a las puntuaciones obtenidas.
Criterios de rendimiento
A veces, los ítems de un test están directamente relacionados con estándares de rendimiento, lo que nos da criterios específicos para evaluar. En estos escenarios, la puntuación de una persona se interpreta con respecto a un criterio, mostrando cuánto domina una habilidad específica. Estos tests, llamados «referidos a criterio», son útiles para medir el conocimiento de un individuo en un área particular o su progreso personal. Permiten determinar si se han logrado ciertos niveles de habilidad y en qué grado. Son muy utilizados en evaluación educativa. Por ejemplo, si alguien responde correctamente al 90% de un test, indica que ha dominado el 90% de lo que el test evalúa.
Estas pruebas, a menudo, establecen puntos de corte para distinguir entre aquellos que dominan una tarea o tienen un trastorno específico. Ejemplos incluyen el Inventario de Desarrollo Battelle, el Beck Depression Inventory (BDI-II), el Beck Anxiety Inventory (BAI) y la Guía de Educación de Preescolar Portage. Hay tests, como el Cuestionario compeTEA, que ofrecen interpretaciones tanto normativas como criteriales, brindando más detalle e información al evaluador.
Ejemplo: Prueba de Matemáticas Referida a Criterio
Supongamos que hay un test diseñado específicamente para medir la habilidad de los estudiantes de cuarto grado en fracciones. El criterio establecido es que los estudiantes deben ser capaces de:
- Identificar fracciones en una recta numérica.
- Sumar y restar fracciones con el mismo denominador.
- Comparar fracciones usando los signos <, > o =.
El test consta de 30 preguntas, 10 para cada habilidad mencionada. Si un estudiante responde correctamente a 27 de las 30 preguntas, eso significa que ha dominado el 90% de las habilidades relacionadas con las fracciones según el test.
Al revisar detalladamente, el docente podría determinar que el estudiante falló en 3 preguntas relacionadas con la suma y resta de fracciones. Esto indica que, aunque tiene un dominio general alto (90%), todavía necesita trabajar específicamente en la habilidad de sumar y restar fracciones.
Con esta información, el maestro puede adaptar su enseñanza o proporcionar materiales adicionales para ayudar al estudiante a mejorar en esa área en particular. No se necesita comparar la puntuación del estudiante con otros en su grado o edad, porque el enfoque está en su dominio personal del material, no en cómo se desempeña en relación con los demás.
Interpretación en función de baremos
Los baremos representan el rendimiento típico de uno o varios grupos de referencia en un test específico. Permiten interpretar la puntuación directa de un individuo comparándola con un grupo normativo. Estas tablas convierten la puntuación directa de un individuo en un valor que indica su posición relativa al grupo de referencia.
La interpretación basada en baremos facilita la comparación de individuos entre sí o con un grupo normativo, mostrando diferencias en el atributo que mide el test. La mayoría de los tests requieren de estos baremos para su interpretación.
El proceso de baremación implica crear escalas de valores para categorizar las puntuaciones según características específicas. En esencia, son tablas que transforman las puntuaciones directas obtenidas en el test en relación con un grupo normativo.
En resumen, los baremos asignan un valor numérico a cada puntuación directa, mostrando cómo se compara esa puntuación (y por ende, la persona) con las del grupo normativo. Hay diversas maneras de realizar esta baremación. Destacamos las siguientes: baremos cronológicos, puntuaciones centiles o percentiles y baremos típicos.
Baremos cronológicos
Los baremos cronológicos son esenciales para comparar puntuaciones de individuos con sus pares de edad, siendo especialmente relevantes en poblaciones infantiles y en tests de inteligencia general. Aunque ciertos baremos, como la Edad Mental (EM) y Edad Cronológica, han caído en desuso, han sido reemplazados por conceptos más actuales, como el Cociente Intelectual (CI) de Desviación.
La EM indica la puntuación promedio que obtiene una población de una edad específica en un test. Sin embargo, tiene limitaciones, como que el incremento de un año en edad mental no tiene el mismo valor a lo largo del desarrollo del individuo.
El CI tradicional se calcula dividiendo la EM por la edad cronológica y multiplicando por 100. A modo de ejemplo, si un niño de 10 años obtiene una puntuación que es típica de un niño de 12 años, su CI sería 120.
A pesar de su popularidad, estos conceptos tienen limitaciones, como que no consideran el factor de edad en comparaciones. El CI de Desviación, una puntuación estándar con un promedio de 100 y desviación típica de 15, supera algunas de estas limitaciones, indicando cuánto se desvía un sujeto del promedio de su grupo de referencia.
Algunos tests, como las Escalas Bayley de Desarrollo Infantil III, utilizan Puntuaciones de Desarrollo. Estas proporcionan una escala para medir el progreso del sujeto con el tiempo, siendo útiles para seguimientos periódicos y analizar evolución en rendimiento a lo largo del tiempo.
Ejemplo: Test de habilidades matemáticas en niños
Imagina que aplicamos un test de habilidades matemáticas a niños de entre 5 y 10 años. Este test ha sido baremado previamente con un grupo normativo de niños en ese rango de edad.
1. Edad Mental (EM): Supongamos que un niño de 7 años realiza el test y obtiene una puntuación que es la media de lo que suelen obtener los niños de 9 años. En este caso, decimos que su Edad Mental (EM) para habilidades matemáticas es de 9 años.
2. Cociente Intelectual (CI): Para calcular su CI tradicional, dividimos su EM (9 años) entre su edad cronológica (7 años) y multiplicamos por 100:
CI = (9/7) x 100 = 128.57. Esto significa que el niño tiene un CI de aproximadamente 129, lo que indica que sus habilidades matemáticas son superiores al promedio de niños de su edad.
3. CI de Desviación: Si consideramos que la puntuación promedio en el test para niños de su edad es 100 con una desviación estándar de 15, y el niño obtiene una puntuación que está a una desviación estándar por encima del promedio, su CI de Desviación sería 115.
Conclusión del ejemplo: A través de estos cálculos, se puede determinar que el niño de 7 años tiene habilidades matemáticas al nivel de un niño promedio de 9 años, con un CI tradicional de 129 y un CI de Desviación de 115, indicando que tiene habilidades superiores para su edad.
Puntuaciones centiles o percentiles
Los centiles, también llamados percentiles, son medidas que indican la posición relativa de una puntuación dentro de una distribución. Un valor en el percentil 80, por ejemplo, significa que un individuo ha obtenido una puntuación igual o superior al 80% del grupo de referencia y solo un 20% ha obtenido una puntuación más alta. Son herramientas útiles para interpretar tests, ya que asignan a cada puntuación directa un valor del 1 al 100, permitiendo conocer qué porcentaje de la población se sitúa por debajo de ese valor.
Por ejemplo, si en un test de perfeccionismo alguien obtiene una puntuación en el percentil 80, podemos inferir que esa persona es más perfeccionista que el 80% de la población de referencia.
Existen otros indicadores similares a los percentiles, como la mediana (que divide la distribución en dos, equivalente al percentil 50), los deciles (dividen en diez partes) y los cuartiles (dividen en cuatro).
Tomando como ejemplo la Batería de Aptitudes de TEA, BAT-7, para estudiantes de 3° ESO, una puntuación directa de 83 puntos en la escala de Concentración corresponde al percentil 65. Esto indica que el estudiante tiene una concentración superior al 65% de su grupo de edad. Otro ejemplo, en la Batería de Aptitudes Intelectuales BAS-II, muestra que un niño de casi tres años con una puntuación directa de 93 en construcción tiene una puntuación T de 58 y se sitúa en el percentil 79.
Ejemplo: Evaluación del rendimiento lector en niños
Imaginemos que estamos evaluando la fluidez lectora en niños de segundo grado utilizando un test estandarizado. La fluidez lectora se mide por la cantidad de palabras que un niño puede leer correctamente en un minuto.
Una vez aplicado el test, obtenemos las siguientes puntuaciones directas para un grupo de niños:
- Niño A: 45 palabras por minuto
- Niño B: 55 palabras por minuto
- Niño C: 65 palabras por minuto
- Niño D: 75 palabras por minuto
Luego de evaluar a varios niños, los resultados se organizan en percentiles. A partir de un baremo previamente establecido para niños de segundo grado, determinamos:
- Percentil 25 (Cuartil 1): 50 palabras por minuto
- Percentil 50 (Mediana o Cuartil 2): 60 palabras por minuto
- Percentil 75 (Cuartil 3): 70 palabras por minuto
Analizando los resultados:
- Niño A está por debajo del percentil 25, lo que indica que su fluidez lectora es inferior al 75% de los niños de su edad.
- Niño B está entre el percentil 25 y 50, por lo que su rendimiento es superior al 25% de los niños pero inferior al 50%.
- Niño C está entre el percentil 50 y 75, superando al 50% de los niños en fluidez lectora.
- Niño D supera el percentil 75, lo que significa que tiene una fluidez lectora mejor que el 75% de los niños de su grado.
De este modo, los percentiles nos permiten situar el rendimiento de cada niño en relación con un grupo de referencia, ofreciendo un contexto para entender su desempeño en la tarea.
Baremos típicos
Las puntuaciones típicas, conocidas como «Zi«, indican cuántas desviaciones estándar está la puntuación de un sujeto respecto a la media de un grupo de referencia. Tienen una media de 0 y una desviación típica de 1. Una puntuación típica de 1.5, por ejemplo, significa que el sujeto está 1.5 desviaciones estándar por encima de la media.
Cuando las puntuaciones no siguen una distribución normal, se puede optar por «normalizar» estas puntuaciones. Las puntuaciones normalizadas, «Zni«, indican la posición de una puntuación dentro de una distribución normal.
Sin embargo, las puntuaciones Zi y Zni pueden ser difíciles de interpretar, especialmente cuando son decimales o negativas. Para solucionar esto, se realizan transformaciones lineales creando «puntuaciones derivadas», que mantienen la distribución original pero con medias y desviaciones estándar más interpretables.
Algunas puntuaciones derivadas comunes son:
- Puntuaciones T: Media de 50, desviación estándar de 10.
- Puntuaciones S: Media de 50, desviación estándar de 20.
- Decatipos (DE): Media de 5.5, desviación estándar de 2.
- Eneatipos (EN): Media de 5, desviación estándar de 2.
- Escala de CI (Cociente Intelectual): Media de 100, desviación estándar de 15.
- Puntuaciones Escalares (Pe): Media de 10, desviación estándar de 3.
Ejemplo:
Imagina un test de habilidad matemática para estudiantes de tercer grado. Si un estudiante tiene una puntuación Z de 1.5, esto significa que supera la media en 1.5 desviaciones estándar. Si esta Z se transforma en una puntuación T, el estudiante tendría una puntuación de 65 (media de 50 + 1.5 veces la desviación estándar de 10). Esta puntuación T de 65 indica que su habilidad matemática es superior a la media del grupo de referencia.
Referencias
- Moreno Rosset and Ramírez Uclés (2019) Evaluación psicológica : proceso, técnicas y aplicaciones en áreas y contextos. Madrid: Sanz y Torres.