Originalidad en profundidad|Un artículo explica claramente los indicadores del análisis de desempeño.
Análisis de puntuación de palabras clave; indicadores; sistema de análisis de desempeño en línea
Los exámenes son un medio importante para examinar los conocimientos y habilidades de los estudiantes. Para aprovechar plenamente la función de los exámenes y hacer que sirvan verdaderamente al propósito de mejorar la calidad de la educación, la forma de evaluar los exámenes es muy importante. El análisis estadístico es el uso de métodos científicos cuantitativos y cualitativos para analizar o evaluar datos estadísticos, sacar conclusiones científicas y comprender la naturaleza y las leyes de las cosas. El sistema de evaluación del desempeño de los estudiantes basado en la teoría del análisis estadístico se puede utilizar para evaluar y monitorear los resultados de los exámenes, y puede descubrir de manera efectiva deficiencias en la enseñanza y los exámenes y realizar mejoras oportunas.
Conclusión La evaluación científica y rigurosa del desempeño de los estudiantes a través del análisis estadístico puede obtener información didáctica rica y proporcionar una base teórica para comprender la calidad del examen en su conjunto. La aplicación del sistema de análisis de desempeño ha mejorado el nivel de las proposiciones y mejorado enormemente la calidad de la enseñanza.
La dificultad es un indicador importante que refleja la dificultad de una pregunta o examen.
El nivel de dificultad refleja si el candidato es apto para el examen. Las preguntas del examen son demasiado difíciles o demasiado fáciles y no reflejan el nivel real de los candidatos. Las preguntas del examen son demasiado difíciles y no todos los candidatos pueden hacerlo; las preguntas del examen son tan fáciles que todos los candidatos obtienen casi la misma puntuación.
Por ejemplo, la dificultad del examen de ingreso a la escuela secundaria y del examen de ingreso a la universidad debe ser moderada. La dificultad de las preguntas del examen de ingreso a la escuela secundaria es de 0,30 a 0,80 y la dificultad de todo el examen es de 0,6 a 0,70. La dificultad de las preguntas del examen de ingreso a la universidad es de 0,30 a 0,70 y la dificultad de todo el examen es de 0,5 a 0,60.
Dificultad: La dificultad de la pregunta.
Refleja si los candidatos se adaptan a las preguntas del examen y las preguntas del examen que son demasiado difíciles o demasiado fáciles no pueden reflejar el nivel real de los candidatos. El valor de dificultad está entre 0 y 1. Cuando P & gt0.8, las preguntas del examen son demasiado fáciles; cuando P & lt0.2, las preguntas del examen son demasiado difíciles. Un examen debe estar compuesto por preguntas de diferente dificultad en una determinada proporción. En términos generales, las preguntas de prueba P & gt0.8, P & lt0.2 representan cada una P = 0.2 ~ 0.4, P = 0.6 ~ 0.8 cada una representa P & gt0.4, P & lt0.6; Las preguntas de dificultad media supondrán el 60%. El nivel de dificultad promedio de todo el conjunto de exámenes está entre 0,4 y 0,6.
① Dificultad de predicción: Qué tan difícil es para el interrogador predecir las preguntas del examen.
②Dificultad real: después del examen, la dificultad se calcula utilizando fórmulas relevantes basadas en los datos medidos.
La fórmula de cálculo de dificultad real es: p = x/m.
Cálculo de dificultad
En general, se cree que P
La discriminación se refiere al grado de discriminación o capacidad de discriminación de la prueba con respecto al nivel real de los estudiantes. . Los trabajos con alta discriminación pueden distinguir a estudiantes con diferentes niveles de conocimiento y habilidades, lo que permite que los estudiantes con altas habilidades obtengan puntajes altos y los estudiantes con bajas habilidades obtengan puntajes bajos. Los trabajos con baja discriminación no pueden distinguir muy bien las habilidades de los estudiantes, por lo que los estudiantes con alta discriminación; Los estudiantes con niveles de habilidad bajos pueden obtener puntajes bajos. El desempeño de los estudiantes de bajo nivel tiene poca diferencia o ningún patrón. La discriminación se puede calcular utilizando el método de agrupación extrema. Primero, ordene las puntuaciones totales de los candidatos de mayor a menor, con el 27% superior de los estudiantes como el grupo alto y el 27% inferior de los estudiantes como el grupo bajo. Calcule las puntuaciones promedio de los estudiantes del grupo alto y de los estudiantes del grupo bajo respectivamente. Si la puntuación total de la prueba es W, la discriminación de la prueba es 0 ~ 1. En general, se considera que el grado de discriminación de las preguntas del examen con D≥0,4 es "excelente"; 0,3 ≤ d < 0,4 es "bueno"; 0,2 ≤ d < 0,3 es el grado de discriminación de las preguntas del examen con D < 0,2; es "pobre".
La discriminación está relacionada con la dificultad de las preguntas del test. En términos generales, las preguntas del examen con dificultad moderada tendrán una mejor discriminación.
Por ejemplo, el examen de ingreso a la escuela secundaria y el examen de ingreso a la universidad generalmente requieren que la distinción de las preguntas del examen sea superior a 0,30, lo que significa que los candidatos con puntajes altos pueden tomar un 30% más de exámenes que los candidatos con puntajes bajos. .
Cuanto mayor sea la discriminación, mejor se podrán distinguir sujetos en diferentes niveles, y mayor será el valor de esta pregunta. Por tanto, cuando la dificultad de la pregunta es media, la discriminación es máxima.
Cuando el coeficiente de dificultad de una pregunta del test está dentro de un cierto rango y tiene un grado de discriminación relativamente alto, la pregunta del test se considera de buena calidad. La calidad de la pregunta del test consiste en la dificultad. y discriminación de la pregunta del test.
La discriminación es el grado en que las preguntas del examen difieren del nivel real del examinado. Es el principal indicador y base para evaluar la calidad de los exámenes y seleccionar las preguntas del examen.
Generalmente representado por D, el valor está entre -1,00 y 1,00. Cuanto mayor sea el valor D, mayor será la capacidad de discriminación de la pregunta del examen.
Cuando d es un valor positivo, significa que las preguntas del examen están diferenciadas positivamente, es decir, la tasa de aprobación del grupo alto es alta y la tasa de aprobación del grupo bajo es baja.
Cuando d es negativo, significa que la pregunta del examen está diferenciada negativamente, con una tasa de aprobación baja para los grupos altos y una tasa de aprobación alta para los grupos bajos.
Cuando D es 0, las preguntas del examen no tienen ningún efecto distintivo.
Cálculo de la discriminación
Análisis de confiabilidad de la prueba: un documento de prueba de alta calidad debe garantizar la confiabilidad de los resultados de la prueba, es decir, la confiabilidad de la prueba. Es un indicador que refleja la estabilidad y confiabilidad de los puntajes de las pruebas, indicando hasta qué punto una prueba refleja el nivel estable del sujeto.
La confiabilidad es un indicador que refleja la consistencia o confiabilidad de una prueba.
Una alta confiabilidad significa resultados de prueba más precisos y errores más pequeños; una baja confiabilidad significa errores grandes.
Las pruebas con baja fiabilidad no pueden evaluar correctamente el nivel de conocimientos y la calidad intelectual de los candidatos.
Por ejemplo, el examen de ingreso a la escuela secundaria y el examen de ingreso a la universidad generalmente requieren que la confiabilidad de las preguntas objetivas sea superior a 0,9, la confiabilidad de las preguntas subjetivas sea superior a 0,7 y la confiabilidad de todo el trabajo sea por encima de 0,8.
Fiabilidad: La confiabilidad se refiere al grado en que los resultados son consistentes cuando el mismo objeto se mide repetidamente usando el mismo método. Una alta confiabilidad significa una medición más precisa y un menor error de medición; una baja confiabilidad significa un gran error de medición. Las pruebas con baja confiabilidad no pueden evaluar correctamente el nivel de conocimiento y la calidad intelectual de los candidatos. El examen de ingreso a la escuela secundaria generalmente requiere que la confiabilidad de todo el examen sea superior a 0,8.
La confiabilidad, por otro lado, es un indicador que refleja la confiabilidad o precisión de un examen (o medición). El grado de diferenciación de las preguntas de la prueba, la diferencia en la puntuación total de cada pregunta y la heterogeneidad entre las preguntas afectarán la confiabilidad.
Fórmula de cálculo:
Por ejemplo, en la pregunta 1 de la primera parte del "Cuestionario de Satisfacción y Utilización de la Biblioteca", si a la misma persona se le hace la misma pregunta con tres días de diferencia, si el encuestado es la primera respuesta es A, la segunda respuesta es C y la tercera respuesta es D, lo que indica que la confiabilidad de los resultados de la encuesta es baja porque los resultados de la encuesta varían mucho. Si elige la misma respuesta o respuestas con poca diferencia tres veces, la confiabilidad de los resultados de la encuesta será mayor si se eliminan los errores sistemáticos.
Fórmula de cálculo:
La tabla de diagnóstico S-P es una herramienta para la gestión y evaluación depurada del proceso docente. Organiza los datos de las calificaciones de las pruebas y ejercicios en listas y realiza un análisis estructurado de las características de los estudiantes y las preguntas con gráficos visuales. Su propósito es obtener información de diagnóstico de aprendizaje de los estudiantes y utilizar los resultados del análisis gráfico para reflejar las características y problemas de los estudiantes P (es decir, información de respuesta de aprendizaje). El módulo de diagnóstico y análisis de tablas S-P no solo puede analizar la tendencia de respuesta de las preguntas del examen grupal, sino también analizar y diagnosticar la tendencia de respuesta de cada estudiante. Las funciones de evaluación de la tabla S&P incluyen:
Utilizando la posición y la forma de las líneas S y P, el aprendizaje de los estudiantes y el diseño de los exámenes se pueden analizar desde diferentes aspectos.
El diagrama de caja fue inventado por el estadístico estadounidense John Tukey en 1977. Consta de cinco puntos numéricos: valor mínimo (min), cuartil inferior (Q1), valor mediano (mediana), cuartil superior (Q3) y valor máximo (max). También puedes agregar promedios a los diagramas de caja. Como se muestra a continuación. Los cuartiles inferior, medio y superior forman una "caja con compartimentos". Se establece una línea de extensión entre el cuartil superior y el valor máximo. Esta línea de extensión se denomina "bigotes".
El valor de los diagramas de caja
A través de los diagramas de caja, al analizar datos, los diagramas de caja pueden ayudarnos efectivamente a identificar las características de los datos:
Gráficos de líneas de caja Se utilizan a menudo para mostrar la dispersión de los datos. Específicamente, calcula la mediana, el 25 % del cuantil, el 75 % del cuantil, el límite superior y el límite inferior de un conjunto de datos, organiza los datos de mayor a menor y muestra visualmente la distribución general de los datos.
La mayoría de los datos normales están en el cuadro y los datos anormales están fuera de los límites superior e inferior.
La fórmula para calcular los límites superior e inferior es:
Descripción del parámetro:
Proceso de cálculo:
Establezca el tipo, el el valor predeterminado es 21 puntaje real 2 %, se recomienda establecerlo en 2 %;
Los elementos de datos estadísticos involucrados incluyen el número de personas que realmente tomaron el examen, el puntaje total del examen, el número de personas en línea (como en línea 1, en línea 2, en línea 3) y el número de personas en línea (como en línea 1, en línea 2, en línea 3) Porcentaje de en línea 1, en línea 2 y en línea 3);
Estadísticas por oficina de educación, escuela y clase;