LA UTILIZACIÓN DE BASES DE DATOS COMO HERRAMIENTAS DE EVALUACIÓN

José Torreblanca López, Matilde Sancho Martínez y Antonio Ariza García

Universidad de Sevilla

 

 

En este artículo se comprueba la validez de utilización de las bases de datos para elaborar pruebas objetivas. Al comparar distintos grupos no se han encontrado diferencias estadísticamente significativas entre los alumnos que realizaban las pruebas elaboradas manualmente por el profesor y los que realizaban las pruebas preparadas por el ordenador. Sin embargo, la flexibilidad que permite este sistema produjo un descenso drástico de los alumnos no presentados al final de curso.

This article examines the validity of the data bases from which objetive tests are elaborated. No statistically significant differences were found between the teacher created tests and those generated by computer. Nevertheless, the flexibility allowed by this system resulted in a drastic reduction in absenteeism for final examinations.

 DESCRIPTORES:Evaluación asistida por ordenador, bases de datos, pruebas objetivas, evaluación.

 

1. Introducción.

En la actividad docente encontramos tres momentos bien definidos, la planificación o programación de la asignatura, la realización en sí (clases, seminarios, practicas, etc.), y por último el proceso de evaluación o control de los resultados obtenidos. Por tanto la evaluación es una actividad sistemática integrada en el proceso educativo, cuya finalidad es servir de diagnóstico, como señala De Ketele (1984), no solo del rendimiento del alumno, sino también del enseñante, los objetivos, la técnica, el método. En definitiva, de todo el proceso de enseñanza-aprendizaje.Metodológicamente,la evaluación resulta de relacionar dos realidades que son: lo observado y lo esperado.

La evaluación es la fase final de un proceso en donde se comprueba si el diseño de enseñanza que se ha llevado a cabo es correcto o no, es decir, si los objetivos que se marcaron al comienzo del proyecto se han logrado o no. Si el alumno ha conseguido los objetivos marcados al comienzo del proceso diremos que éste ha sido planteado de forma correcta; si no es así tendremos que replantear y corregir lo que sea necesario.

Son muchos los procedimientos de evaluación que podemos utilizar, siendo válidos todos aquellos que sean capaces de poner de manifiesto si las actividades del profesor y del alumno llevan al logro de los objetivos propuestos.

Una de las técnicas de evaluación utilizadas con más frecuencia en el campo de la enseñanza son las pruebas objetivas. Las pruebas objetivas se pueden considerar como un examen escrito con carac-terísticas muy concretas entre las que cabe destacar como más interesantes:

- Las preguntas han de ser muy breves.

- Han de estar enunciadas muy claramente.

- Deben permitir una calificación cuantitativa rápida.

 

La mayor dificultad de esta técnica de evaluación es que dada la exigencia de objetividad que tiene esta prueba, la redacción de sus ítems no es algo simple y elemental. Una redacción adecuada exige del profesor preparación, imaginación, esfuerzo y práctica.

Estas pruebas de tipo "test" permiten valorar fundamentalmente la información que posee el alumno sobre el contenido de la asignatura, pero no valoran otros aspectos como la creatividad, la capacidad de elaboración y expresión personal de los contenidos, la originalidad, etc. Las principales ventajas de este sistema radican en que puede abarcar gran parte de los temas tratados en clase, la evaluación es totalmente objetiva y es de gran facilidad de corrección.

Modelos de pruebas objetivas hay varios que, en esencia coinciden, aunque varían en el enunciado de los apartados. Los más conocidos son los modelos propuestos por Norman Gronlund (1971, 1974), García Hoz (1946), Fernández Huertas (1950) y Marín Ibáñez (1971) en sus respectivas obras.

Norman Gronlund propone los siguientes tipos de preguntas:

1.- Respuesta íntegra por el estudiante.

- La respuesta es una frase íntegra o texto.

- La respuesta es interpolar palabras en una frase o texto.

2.- Selección de respuesta entre varias.

- Contestar Verdadero o Falso.

- Elección de la respuesta entre varias dadas (Elección múltiple).

 

García Hoz propone el siguiente:

1.- Evocación de un recuerdo.

- Respuesta simple a una pregunta.

- Texto mutilado.

2.- Reconocimiento de un recuerdo.

- Respuestas sugeridas.

- Elección entre ambas.

- Elección única.

- Elección múltiple.

- Apreciar la mejor respuesta.

- Verdadero o Falso.

- Asociar conocimientos.

 

Las normas para la elaboración de ítems con respuestas de Verdadero o Falso que propone Gronlund son las siguientes:

- Cada uno debe expresar solo una idea.

- Evitar información de tipo general.

- Si es una opinión, teoría o hipótesis de algún autor o escuela debe decirse.

- Deben evitarse las afirmaciones no significativas en el conocimiento de la materia.

- No deben hacerse formulaciones negativas ni excesivamente largas.

- Las formulaciones verdaderas o falsas deben ser de la misma longitud.

- Repartir el número de enunciados de forma homogénea por el texto.

 

Para la formulación de ítems de elección múltiple, que tiene la siguiente estructura:

Enunciado = Base

Posibles respuestas = Opciones

Opciones falsas = Distractores

Opción verdadera = Respuesta

propone para su elaboración:

- Formulación de un solo problema en la base, que debe ser claro y sencillo, incluyendo más palabras en la base, descargando a la respuesta de información.

- No incluir en la base información negativa.

- Formulación muy precisa de la base.

- Evitar formulación en donde se incluyan pistas que conduzcan a la respuesta sin saberla.

- Formular los distractores de forma que resulten verosímiles y homogéneos con la respuesta.

 

En el caso de grandes grupos la utilización de pruebas objetivas es muy adecuada, aunque su preparación es compleja, permite una fácil corrección.

Debido a la bondad de este tipo de pruebas se han desarrollado proyectos de investigación como the Cooperative project on Evaluation of Results of Training (CERT) (Alonso 1984). Como indican De Pablos y otros (1993) en el seno de este proyecto se desarrolló un programa informático que apoya y facilita el uso de pruebas objetivas en la evaluación educativa, posibilitando gestionar gran cantidad de información recogida a través de pruebas objetivas de opción múltiple y analizarla, agilizando el proceso de manipulación y cálculos manuales de los formadores para evaluar aprendizajes. Una de las características principales de este programa es la inclusión de los denominados niveles de confianza que son una estimación que el alumno realiza en base a una escala de 0-5 del grado de confianza o seguridad con que responde a cada una de las cuestiones de la prueba.

Las capacidades del ordenador pueden utilizarse en un amplio rango de actividades relacionadas con los test. En concreto el ordenador se puede utilizar para escribir ítems, construir bancos de ítems, construir y administrar test, así como puntuar, analizar e informar de los resultados obtenidos en los test. Para llevar a cabo estas actividades en la actualidad se dispone de un elevado número de recursos tecnológicos (Rodríguez, García y Gil, 1996).

Como destacan Arriaga y otros (1996) el desarrollo del software educativo está llegando a un punto en el que los nuevos programas no mejoran sustancialmente el interés de los profesores por incorporarlos a la docencia, normalmente por sus entornos cerrados en los que no es posible la modificación y se obliga a una aceptación tal cual.

Intentando salvar estos inconve-nientes nuestro primer objetivo ha sido verificar la validez de la utilización de las bases de datos como un primer paso en la elaboración de un programa de evaluación asistido por ordenador.

 

 2. Material y método.

Se ha utilizado un programa de base de datos (dbase IV) para la gestión de un conjunto de preguntas de respuesta múltiple que, con anterioridad había sido empleado en cursos previos. Estas bases de datos se pueden ir actualizando y aumentando continuamente. La objetividad del sistema será mejor cuanto mayor sea la base de datos.

En un primer análisis, nos planteamos comprobar la validez del uso del ordenador para la realización de estas pruebas, para ello, estudiamos las posibles diferencias con los resultados que se habían obtenido previamente con exáme-nes elaborados manualmente por el mismo profesor. Así, el primer punto que nos fijamos para verificar la posibilidad de utilización de este sistema de exámenes fue comprobar la diferencia que podría existir con los cursos de años anteriores en los que la preparación del examen la hacía el profesor escogiendo un mismo número de preguntas de los diferentes temas en contraste con el ordenador que escoge las preguntas de manera aleatoria. Para esta comprobación se utilizaron listas de preguntas que habían servido para exámenes de cursos anteriores. Con el fin de que las condiciones experimentales fueran lo más homogéneas posibles, los cursos fueron seleccionados para que el temario de cada parcial y la fecha de realización de éste fueran similares. Los resultados se analizaron con las corres-pondientes pruebas estadísticas de análisis de diseño experimental en el que se comparan dos tratamientos midiendo una variable de respuesta cuantitativa.

 

3. Resultados.

Como se puede observar las notas (sobre un máximo de 6 puntos) de los diferentes cursos son algo distintas, pero si se analizan estadísticamente, utilizando el test T de Student-Fisher para comparación de medias, estas diferencias no son signi-ficativas como se puede observar en la siguiente tabla y su correspondiente gráfico.

  

Primer Parcial

Media ± E. Std.

N

curso 90-91

3.49 ± 0.22

30

curso 91-92

3.12 ± 0.26

20

curso 94-95

2.95 ± 0.18

28

Primer Parcial (parte objetiva)

Primer Parcial (parte objetiva)

Al realizar el seguimiento de los datos que se obtuvieron en el segundo parcial se puede comprobar que el sistema es totalmente válido pues al aplicar las pruebas estadísticas, antes comentadas, no hay ninguna diferencia significativa entre los grupos, como se puede observar en la tabla:

  

Segundo Parcial

Media ± E. Std.

N

curso 90-91

3.36 ± 0.23

31

curso 91-92

3.83 ± 0.27

16

curso 94-95

3.87 ± 0.17

28

Segundo Parcial (parte objetiva)

Segundo Parcial (parte objetiva)

 

Esta igualdad entre los tres diferentes cursos se mantiene al analizar los resultados de la convocatoria de Junio (nota sobre 10):

  

Convocatoria de Junio

Media ± E. Std.

N

curso 90-91

6.17 ± 0.47

27

curso 91-92

6.47 ± 0.34

17

curso 94-95

6.78 ± 0.21

29

Convocatoria de Junio

Convocatoria de Junio

Una vez que parece establecida la igualdad entre los dos sistemas de generación de pruebas, debemos de resaltar que la utilización del ordenador permite una flexibilidad mucho mayor en la elaboración y realización de éstas. Actualmente la estamos utilizando, para ofrecer a los alumnos la posibilidad de presentarse al examen, previa cita, en día diferente al concertado con todo el grupo de clase. Esto no es una novedad, ya se podía hacer antes, pero no con la facilidad actual, que realmente pone a nuestro al-cance esta posibilidad y con el efecto motivador que tiene para el alumno.

Este simple cambio es el que se ha mostrado muy importante, y como consecuencia de su mas fácil adaptación al ritmo de aprendizaje del alumno, es el que provoca que el porcentaje de alumnos no presentados en los últimos cursos impartidos sea tan diferente con el actual.

  

Curso

Alumnos no presentados (%)

90-91

22.85

91-92

37.03

92-93

39.13

93-94

33.33

94-95

6.45

Porcentaje de Alumnos No Presentados

Porcentaje de alumnos no presentados

Si comparamos los datos mediante el test T de datos apareados la diferencia es significativa para p = 0.005.

 

4. Discusión.

Tras el análisis de estos datos se puede concluir que el sistema de elaboración de exámenes por extracción aleatoria de preguntas de las bases de datos existentes, ofrece los mismos resultados que los exámenes realizados manualmente por el propio profesor que ha generado la base de datos. Con lo que se podría concluir que la ventaja del sistema recae sobre todo del lado del profesor al permitirle generar con gran facilidad exámenes diferentes. Sin embargo el alumno también se ve favorecido por esta herramienta, no sólo por el hecho de evitar cualquier temor de subjetividad por parte del profesor, sino que también al flexibilizar el periodo de presentación del alumno al examen, éste lo hace cuando realmente se siente preparado y no cuando le obligue la fecha establecida por todo el grupo de clase, intentando una fecha consensuada, que generalmente no es la mejor para cualquiera de los alumnos individualmente.

Aparte de lo descrito anteriormente este sistema favorece la responsabilidad personal de cada alumno sobre su proceso de enseñanza-aprendizaje al tener un control mucho mayor sobre los momentos que más tensión causan en el alumnado.

Se puede observar que existe una clara mejora de resultados en los alumnos al tener la posibilidad individualizada de examen. La mejora creemos que residiría no sólo en un mayor tiempo para poder afianzar los conocimientos, si no que además el alumno, al elegir el día en que va a examinarse escoge éste con todas las garantías para poder desarrollar su aprendizaje en las mejores condiciones. No estando supeditado al día que elige el curso que no es otro que el menos malo de todos los posibles. En esta simple diferencia creemos que reside la disparidad de resultados que se ha podido poner de manifiesto en este estudio. Los resultados obtenidos son tan esperan-zadores que esperamos continuar con el desarrollo del sistema y con la posible elaboración de un programa de ordenador que permita no sólo elaborar sino corregir las diferentes pruebas.

 

Referencias bibliográficas.

ALONSO, C.y OTROS (1992). Principios comunes para la evaluación de los resultados cognitivos de la formación. Comisión de las Comunidades Europeas. Programa Eurotecnet.

ARRIAGA, J.y OTROS (1996). Sistemas de autor orientados a un fin educativo específico. Pixel-Bit. Revista de Medios y Educación, 6. 5-13.

DE KETELE, J.M.(1984). Observar para Educar. Observación y evaluación en la práctica educativa. Madrid, Visor Libros.

DE PABLOS PONS, J. y OTROS( 1993). La evaluación del alumno en la Universidad: el proyecto CERT. Revista de Enseñanza Universitaria, 6. 49-71.

FERNÁNDEZ HUERTA, J.(1950). Las pruebas objetivas en la escuela primaria, Madrid, C.S.I.C.

GARCÍA HOZ, V.(1946). Normas elementales de Pedagogía Empírica. Madrid, Escuela Española.

GRONLUND, N.: (1971) Medición y evaluación en la enseñanza. México, Pax-México.

GRONLUND, N. (1974) Elaboración de test de aprovechamiento. México, Trillas.

MARÍN IBÁÑEZ, R.(1971). Las pruebas objetivas, Universidad de Valencia, Facultad de Filosofía y Letras, Valencia.

RODRÍGUEZ GÓMEZ, G., GARCÍA JIMÉNEZ, E. y GIL FLORES, J.: Recursos tecnológicos en la investigación educativa Pixel-Bit. Revista de Medios y Educación, 6. 55-75.