Red de conocimiento informático - Conocimiento informático - Cómo calcular la dificultad y diferenciación de los exámenes

Cómo calcular la dificultad y diferenciación de los exámenes

Análisis cuatridimensional del test: dificultad, discriminación, fiabilidad, validez

1. Dificultad La dificultad se refiere a la dificultad de las preguntas del examen. Es un parámetro indicador importante para medir la calidad de las preguntas del examen. Tiene el mismo impacto que la discriminación y determina la discriminación del examen. En general, se cree que el índice de dificultad de las preguntas del examen está entre 0,3 y 0,7, y la dificultad promedio de todo el trabajo es mejor alrededor de 0,5. No debería haber demasiadas preguntas por encima de 0,7 y por debajo de 0,3. 1. Dos definiciones de dificultad:

(1) P=1-x/w x es la puntuación promedio de una determinada pregunta y w es la puntuación completa de la pregunta.

(1) P=1-x/w x es la puntuación promedio de una determinada pregunta y w es la puntuación total de la pregunta.

En este método de definición, el valor de una pregunta difícil es fácil, lo que indica que el valor de la pregunta es pequeño, el valor de una pregunta menos difícil es grande, lo que indica que el valor de la pregunta es pequeño y el valor de una pregunta difícil es grande. El valor mínimo es 0 y el valor máximo es 1.

2. Dificultad de cálculo:

(1) Dificultad de las preguntas subjetivas<. /p>

Un método de fórmula básica:

Método de fórmula básica.

Método de fórmula básica: P=1-x/w

Método de agrupación extrema P=1-(XH XL)∕2W XH: promedio de la puntuación de agrupación alta (27 principales), XL: Puntuación media del grupo bajo (27 últimos).

(2) Dificultad de las preguntas de la prueba objetiva

Un método de fórmula básica: P=1-R/N R es el número de respuestas correctas y N es el número de todas las respuestas.

B Método de agrupación extrema: P=1-(PH PL)∕2

PH=RH/n se denomina tasa de aprobación de grupo alto, RH: el grupo alto con el número de respuestas correctas, n: Top 27 del número total de personas. PL=RL/n se denomina tasa de aprobación del grupo bajo, RL: el número de personas en el grupo bajo que respondieron correctamente.

2. Discriminación La discriminación es un índice que distingue el nivel de habilidad de los examinados. Un alto grado de diferenciación en las preguntas de la prueba puede ampliar la brecha entre las puntuaciones de los candidatos en diferentes niveles, de modo que las puntuaciones altas pueden conducir a niveles altos de logro y las puntuaciones bajas pueden conducir a niveles bajos de competencia. Sin embargo, los niveles bajos de diferenciación no pueden. Reflejar las diferencias de nivel entre diferentes candidatos. La discriminación de las preguntas del examen está directamente relacionada con la dificultad de las preguntas del examen. En general, la discriminación de las preguntas del examen de dificultad media es mayor. Además, la discriminación de las preguntas del examen está estrechamente relacionada con el nivel del examinado. Sólo cuando la dificultad de las preguntas del examen es igual o ligeramente inferior a la capacidad real del examinado, se puede distinguir las preguntas del examen. reflejado plenamente. Evaluación del índice de diferenciación: -1,00≤D≤1,00 Cuanto mayor sea el índice de diferenciación, más fuerte será la diferenciación de las preguntas del test. Generalmente se considera que si el índice de discriminación es superior a 0,3, se pueden aceptar las preguntas del examen. 2. Cálculo de la discriminación: fórmula básica: D = (H-L) ÷ N (D representa el índice de discriminación, H representa el número de preguntas del examen en el grupo alto, L representa el número de preguntas del examen en el grupo bajo y N representa el número de personas en un grupo, es decir, la suma del número de personas del grupo alto y el número de personas del grupo bajo). Método de agrupación de valores extremos:

(1) Pregunta subjetiva: D=SH-SL∕n(WH-WL)

SH: la puntuación total del grupo alto, SL: la grupo bajo Puntaje total, WH: el puntaje más alto de la pregunta, WL: el puntaje más bajo de la pregunta, n es el número de personas en el grupo alto (o grupo bajo), es decir, 27 del número total de personas.

(2) Preguntas de prueba objetivas: D= PH-PL, o D= RH-RL∕n

(3) En general, también se puede utilizar D=XH-XL ∕Xfull para calcular. XH: puntuación media de la pregunta del grupo alto; XL: puntuación media de la pregunta del grupo bajo; Xfull: puntuación total de la pregunta: puntuación total de la pregunta.

3. Confiabilidad La confiabilidad se refiere a la consistencia o estabilidad de los resultados. Cuanto más fuerte sea la estabilidad, más confiables serán los resultados de la evaluación. Por el contrario, si se prueba dos veces un determinado conjunto de preguntas del examen con el mismo candidato y el resultado es 80 puntos la primera vez y 50 puntos la segunda vez, la confiabilidad de los resultados es cuestionable. La confiabilidad generalmente se expresa mediante el coeficiente de correlación entre los resultados de dos evaluaciones. Un coeficiente de correlación de 1 indica que el examen y otras herramientas de evaluación son completamente confiables; un coeficiente de correlación de 0 indica que el examen no es completamente confiable. Generalmente se requiere que la confiabilidad sea 0,7 o superior.

Métodos para evaluar la confiabilidad: (1) método de prueba-reprueba; (2) método de prueba dividida por método duplicado; (3) método de plegado o: utilizar tres métodos para evaluar la confiabilidad de prueba-reprueba, la confiabilidad por duplicado y la confiabilidad sexual de consistencia interna; La confiabilidad test-retest se refiere al coeficiente de correlación entre los dos resultados de la evaluación cuando el mismo examen se administra al mismo grupo de candidatos dos veces seguidas en las mismas condiciones. La confiabilidad repetida se refiere al coeficiente de correlación entre los resultados de la evaluación utilizando dos o más exámenes que son idénticos en concepto, contenido, dificultad, tipo de pregunta y tamaño de la pregunta. La confiabilidad de la consistencia interna se refiere a la consistencia entre las preguntas dentro del examen. Por lo general, el examen se divide en dos mitades y luego se calcula el coeficiente de correlación entre la mitad del examen y la otra mitad.

2. Coeficiente de confiabilidad γxx=ST2∕SX2 ST2 se denomina varianza de puntuación verdadera y SX2 es la varianza de puntuación obtenida. El valor máximo del coeficiente de confiabilidad es 1, lo que indica una alta confiabilidad de la prueba; el valor mínimo es 0, lo que indica una baja confiabilidad de la prueba. Esta prueba se puede utilizar para comparaciones entre grupos cuando γxx ≥ 0,70. Cuando γxx ≥ 0,85, esta prueba se puede utilizar para comparación interindividual.

4. Validez La validez se refiere al grado en que una prueba puede probar las cosas que prueba, es decir, el grado en que los resultados de la prueba son consistentes con los objetivos de la prueba. Cualquier método de prueba, no importa cuán bueno sea en otros aspectos, si la validez es demasiado baja, los resultados de la prueba no serán los que se pretende evaluar (como el uso de exámenes de inglés para evaluar las habilidades matemáticas de los estudiantes). para la prueba actual, En términos de cosas, la prueba pierde su valor. Debido a las características de los propios fenómenos psicológicos, la validez de la evaluación es particularmente importante. La psicología es algo espiritual. En la actualidad, la gente no puede observarla directamente. Sólo pueden inferir las características psicológicas de una persona a partir de su patrón de comportamiento o de su reacción a las preguntas de los exámenes. Por ejemplo, la inteligencia se infiere principalmente en función de las respuestas de un individuo a algunas preguntas y resultados como la precisión y las tasas de error. La validez es un concepto relativo, es decir, solo existe una diferencia entre alta validez y baja validez, pero no hay diferencia entre toda efectividad y toda invalidez. La validez se puede dividir en validez cuantitativa, validez de contenido, validez conceptual, validez predictiva y validez temporal.

上篇: Introducción al modelo de difusión Bath 下篇: ¿Hay misiones de taxi ilimitadas en Yakuza 5?

Cómo calcular la dificultad y diferenciación de los exámenes

Artículos populares