Validez de un Test: Tipos, Fuentes de Evidencia y Evolución
Enviado por Chuletator online y clasificado en Magisterio
Escrito el en español con un tamaño de 5,56 KB
Validez de un Test
Introducción
Tradicionalmente, se ha definido la validez de un test como su capacidad para medir lo que pretende medir. Por ejemplo, un test de inteligencia sería válido si efectivamente mide la inteligencia. Esta perspectiva, que se basaba en análisis factoriales, se considera actualmente desfasada.
En la actualidad, la validez se entiende como sinónimo de justicia. Al obtener conclusiones a partir de un test, es fundamental hacerlo de manera justa. Si el test carece de validez (expresión incorrecta, como veremos más adelante), las decisiones que se tomen con base en él no serán justas.
2. Evolución Histórica de la Validez
La evaluación de la validez ha evolucionado a lo largo de la historia, generalmente a través de los "Standars".
Inicialmente, se consideraba la validez como un concepto unitario: un test o era válido o no lo era. Para determinar la validez, se recurría a las evidencias de validez.
En la edición de 2014 de los "Standars", se pone énfasis en la accesibilidad y el diseño universal, buscando evaluar a todas las personas en igualdad de condiciones y con justicia.
Es importante destacar que la expresión "la validez de un cuestionario" es incorrecta. Un cuestionario no es válido o inválido en sí mismo. Lo que se valida es la interpretación de las puntuaciones. Es decir, se valida el uso del test, no el test como instrumento. Un test puede ser adecuado para un propósito, pero no para medir lo que se pretende (puede medir adecuadamente otra cosa).
La validez de las interpretaciones se evalúa en función del objetivo del test.
3. Fuentes de Evidencia de la Validez
Las fuentes de evidencia de validez son pruebas que nos ayudan a determinar si las interpretaciones que hacemos del test son las adecuadas. Se utilizan cinco fuentes principales para evaluar la validez:
- En relación al contenido del test
- En relación a la estructura interna
- En relación a los procesos de respuesta
- En relación a la relación con otras variables
- En relación a las consecuencias de la evaluación (si hay consecuencias negativas o no)
Es necesario analizar todas las fuentes de evidencia para determinar cuáles son sólidas y cuáles no.
3.1. Contenido del Test
Los ítems del test deben ser relevantes y representativos de las dimensiones que se pretenden evaluar.
Para asegurar esto, se debe partir de la dimensión semántica y de la tabla de especificaciones. Esto permite verificar si se está cumpliendo con la estructura del test planteada.
Una forma útil de evaluar esta evidencia de validez es a través del juicio de expertos. Se presentan los ítems a un grupo de expertos, quienes deben determinar si son representativos del contenido que se pretende medir. Es decir, si todos los ítems son relevantes para el constructo que se quiere medir y si los que lo son, son representativos del mismo.
En caso de discrepancias entre los juicios de los expertos, se pueden realizar reuniones de conciliación para llegar a un consenso sobre los ítems que generan opiniones divergentes.
3.2. Procesos de Respuesta
La estrategia más adecuada para evaluar los procesos de respuesta es el protocolo de pensamiento en voz alta. Se le pide al sujeto que verbalice su razonamiento al responder cada ítem. A partir de este razonamiento, se puede determinar si la respuesta realmente representa el constructo que se pretende medir.
3.3. Estructura Interna
A diferencia de las dos anteriores, esta fuente de validez se comprueba en la mayoría de los casos. Se basa en analizar la relación entre los ítems del test y sus diferentes partes. El objetivo es determinar si estas relaciones se ajustan a lo que predice la teoría sobre el constructo.
El análisis factorial exploratorio agrupa los ítems en función de las correlaciones entre ellos. Si todo es correcto, los ítems de una misma dimensión (factor) tendrán una alta correlación lineal entre sí. Si no es así, significa que uno o más ítems no están midiendo lo que se pretende.
En el análisis factorial confirmatorio, se establece la estructura que se espera que tengan los datos y luego se confirma con los datos obtenidos al aplicar el test. Es decir, se define qué ítems se agruparán en cada factor y se intenta confirmar esa estructura con los datos reales.
El DIF (funcionamiento diferencial del ítem) se refiere a la posibilidad de que un ítem funcione de manera diferente para individuos de distintos grupos, perjudicando a un grupo en particular.
3.4. Relación con Otras Variables
En esta fuente de validez, se correlacionan las puntuaciones del test con variables externas que están relacionadas con el constructo. Es decir, se busca la correlación entre las puntuaciones del test y otras variables que, según la definición sintáctica del constructo, deberían estar relacionadas con él.
En la relación con otras variables, el constructo debe comportarse de la manera esperada.
3.5. Consecuencias
Las consecuencias de la evaluación se refieren al impacto que tiene la evaluación en sí misma. Al evaluar algo, se está generando una consecuencia posterior.
En ocasiones, al intentar implementar diversas estrategias y modificaciones para mejorar la validez, se puede perder de vista la finalidad de la evaluación.