Importancia de los Test Psicométricos en la Evaluación de Competencias
Enviado por Chuletator online y clasificado en Diseño e Ingeniería
Escrito el en
español con un tamaño de 4,65 KB
Propósito de los Test
Los test tienen diversos propósitos, tales como:
- Diagnóstico
- Selección
- Orientación/consejo
- Clasificación
- Certificación de una competencia
- Descripción/información
Los instrumentos pueden ser subjetivos u objetivos. Los tipos de instrumentos de medida incluyen:
- Rating scales
- Rating scales conductuales (miden habilidad)
- Listados e inventarios
- Encuestas y cuestionarios
- Test psicométricos
Desarrollo del Test
El desarrollo de un test implica los siguientes pasos:
- Definir el constructo
- Identificar las conductas que definen el constructo
- Elaboración de ítems y revisión teórica
- Pre-testing
- Ensayo piloto
- Aplicación en una muestra más amplia
- Análisis psicométrico de los ítems
- Estudios de fiabilidad y validez
- Normas de aplicación
- Puntuación e interpretación
Tipos de Aproximación en la Definición de Constructo
Existen dos tipos de aproximación:
- Idiográfica: caso específico
- Nomotética: universal, generalizable
Modelo Clásico de Test
El modelo clásico de test se basa en la distribución normal, donde:
- La puntuación verdadera es la media de la distribución teórica de las puntuaciones observadas.
- Los errores siguen una distribución normal cuya media es 0.
- La correlación entre las puntuaciones verdaderas y de error es 0.
- Los errores son aleatorios y no se puede establecer un patrón de error que afecte a las puntuaciones verdaderas.
- No existe relación entre los errores para cualquier par de personas o de aplicaciones distintas.
- La media de las puntuaciones empíricas es igual a la media de las puntuaciones verdaderas.
- La varianza de las puntuaciones empíricas es igual a la varianza de las puntuaciones verdaderas más la varianza de error.
Fiabilidad
La fiabilidad es el grado en que la repetición de la medida ofrece un mismo valor. El coeficiente de fiabilidad es la proporción de varianza verdadera que está en la varianza empírica, adoptando valores entre 0 y 1, donde:
- pxx = 1 indica fiabilidad perfecta.
El índice de fiabilidad es la razón entre la desviación típica de las puntuaciones verdaderas y la desviación típica de las puntuaciones observadas. La regresión a la media aumenta cuando baja el coeficiente de fiabilidad. La correlación aumenta cuando baja el coeficiente de fiabilidad. En un grupo homogéneo, el coeficiente de fiabilidad es más bajo que en uno heterogéneo.
Métodos para Evaluar la Fiabilidad
Los métodos para evaluar la fiabilidad incluyen:
- Test-retest: coeficiente de fiabilidad
- Método de las formas paralelas: coeficiente de equivalencia
- Método de las 2 mitades: 1 aplicación, dividir el test en 2, correlación entre ambas partes se obtiene la correlación mitad. Para total, Spearman-Brown k=2/rulon = fiabilidad sin realizar correlación previa entre las 2 mitades.
Alta consistencia interna se refiere a componentes homogéneos entre sí, evaluada mediante el alfa de Cronbach, KR20, KR21. El coeficiente de fiabilidad indica que las puntuaciones obtenidas en la primera ocasión no cambian con respecto a la segunda, mientras que el coeficiente de equivalencia indica que las puntuaciones son prácticamente intercambiables.
Consistencia Interna
La consistencia interna se refiere a la amplia covariación. Los índices que permiten conocer la calidad de los ítems incluyen:
- Índice q, que describe la distribución de respuestas (medias y varianzas).
- Índices que describen el grado de relación entre las respuestas a un ítem y algún criterio (índice de discriminación).
La media de un ítem dicotómico es el índice de dificultad (pj). La varianza máxima se alcanza cuando pj = qj = 0,50, siendo lo máximo, con varianza = 0,25.
Análisis de Homogeneidad y Validez
El análisis de homogeneidad se considera un criterio interno, mientras que el análisis de validez se considera un criterio externo. La homogeneidad se evalúa mediante la correlación de Pearson, y el índice D varía de -1 a 1. Existen métodos como el biserial puntual (natural) y el biserial (forzada). La discriminación se mide de 0 a 3. El coeficiente de validez se evalúa mediante la correlación de Pearson, que varía de -1 a +1, donde 0 indica no relación. La comunalidad varía de 0 a 1.