OEI

Organización
de Estados
Iberoamericanos


Para la Educación,
la Ciencia
y la Cultura

Formación continuada del profesorado de Ciencias.
Una experiencia en Centroamérica y El Caribe

1.4. Ejemplo de uno de los módulos desarrollados:
La evaluación del proceso de enseñanza/aprendizaje de las Ciencias

(Taller de investigación dirigida)

Daniel Gil Pérez
Universitat de València

Índice

Presentación

Presentaremos aquí con algún detalle un ejemplo de la forma de trabajo realizado en la fase presencial de Panamá, donde cada módulo fue concebido como un taller dedicado a abordar las distintas problemáticas, en forma de una investigación dirigida.

Hemos pretendido, con ello, salir al paso de la escasa efectividad mostrada por los cursos destinados a transmitir al profesorado las propuestas elaboradas por los expertos. Se ha comprendido, en efecto, que, sólo si los profesores participamos en la construcción de las nuevas orientaciones didácticas, podremos incorporarlas a nuestra actividad docente. Y se ha comprendido, igualmente, que el profesorado puede realizar esta tarea con interés y excelentes resultados, si se crean las condiciones que favorezcan un trabajo colectivo con las características de una investigación dirigida.

Esto es lo que hemos intentado hacer en este taller dedicado a la evaluación del proceso de enseñanza/aprendizaje de las ciencias y lo que pretendemos reflejar aquí a título de ejemplo. Coherentemente con ello, este documento no constituirá un artículo al uso, sino la transcripción, obviamente resumida, del trabajo realizado por los equipos de profesores, que fueron abordando las actividades del programa de investigación propuesto y cotejando sus producciones con las de los otros equipos y con el resto de la comunidad científica. A tal efecto, las actividades ( designadas como A.1., A.2., …) van acompañadas de comentarios que resumen el desarrollo de las mismas, el contenido de las intervenciones de los participantes en el taller, las puestas en común, etc. De esta forma, el lector podrá realizar el seguimiento del proceso de construcción de conocimientos didácticos en torno a la evaluación que este programa de actividades pretende favorecer.

La evaluación del proceso de enseñanza/aprendizaje de las Ciencias
(Programa de actividades y comentarios)

Quizás debamos comenzar planteándonos si merece la pena dedicar mucha atención a esta cuestión de la evaluación. ¿No sería mejor ocuparse de otros aspectos más atractivos, más susceptibles de contribuir a la renovación de la enseñanza? ¿Acaso la evaluación no constituye un aspecto, sin duda necesario, pero rutinario (y más bien desagradable), en el que más vale no detenerse demasiado? En otras palabras:

A.1. ¿Puede considerarse útil dedicar parte de nuestro escaso tiempo a tratar la cuestión de la evaluación?

C.1. Conviene detenerse en justificar el interés de esta primera actividad. En primer lugar porque no tiene sentido embarcarse en una tarea sin haber reflexionado mínimamente acerca de su relevancia (algo que, desgraciadamente, olvidamos muy a menudo en el trabajo con los estudiantes). Pero, además, porque la atención dada a la evaluación desde la didáctica de las ciencias ha sido realmente escasa hasta muy recientemente. Como señala Tamir (1998) en el recientemente publicado International Handbook of Science Education, si dicho Handbook se hubiera publicado hace 10 años, no hubiera contenido una sección dedicada a la evaluación. La situación ha comenzado a cambiar desde finales de los años ochenta y hoy la evaluación constituye una línea de investigación prioritaria en didáctica de las ciencias.
¿A que se debe este creciente interés? La reflexión de los profesores que asisten al taller, cuando se les plantea una actividad como la A.1, les lleva a referirse al peso que la evaluación tiene en los estudiantes (“su atención se dirige exclusivamente a lo que puede ser objeto de examen”) y en los profesores (“que ven condicionada su enseñanza por las pruebas externas”), a las dificultades para ajustar la evaluación a las innovaciones introducidas en la enseñanza, a las tensiones y enfrentamientos entre profesores y alumnos que suele generar la evaluación, etc.
Es esencial recoger todas estas preocupaciones, señalar su pertinencia y referirse a los estudios e investigaciones que las apoyan. Podemos así referirnos a que, en los últimos años hemos asistido a un importante desarrollo de la innovación en la enseñanza de las ciencias, apoyada en investigaciones sistemáticas, que, sin embargo, encuentra dificultades para ser transferido a la práctica docente. Como ha señalado Briscoe (1991), cada año miles de profesores participan en seminarios o asisten a cursos (¡como al que están asistiendo!) con la intención de perfeccionarse profesionalmente y cuando reanudan sus clases creen estar mejor preparados para utilizar las nuevas técnicas, los nuevos materiales curriculares, las nuevas formas de favorecer la creatividad y el aprendizaje de sus alumnos. Sin embargo, muchos de estos profesores y profesoras se encuentran, antes de que puedan darse cuenta, enseñando de la misma forma como lo habían hecho siempre, adaptando los nuevos materiales o técnicas a los patrones tradicionales. Se genera así una lógica frustración y decepción al percibir que las cosas no han funcionado mejor que los años precedentes a pesar de las nuevas y prometedoras ideas.
En nuestra opinión, este resultado no es debido, muchas veces, a que las innovaciones contempladas en los cursos de formación carezcan de interés, sino que pone en evidencia que un modelo de enseñanza es algo más que un conjunto de elementos dispersos e intercambiables: posee una cierta coherencia y cada uno de sus elementos viene apoyado por los restantes (Viennot, 1989; Gil, 1991). Se ha empezado así a comprender que los esfuerzos de innovación en la enseñanza de las ciencias realizados estas últimas décadas pierden gran parte de su capacidad transformadora si quedan en aportaciones puntuales, desligadas. Muy en particular, los investigadores han llamado la atención sobre la necesidad de acompañar las innovaciones curriculares de cambios similares en la evaluación para contribuir a consolidar el cambio de paradigma didáctico actual (Linn, 1987). Poco importan, en efecto, la innovaciones introducidas o los objetivos enunciados: si la evaluación sigue consistiendo en ejercicios para constatar el grado de retención de algunos conocimientos conceptuales, éste será para los alumnos el verdadero objetivo del aprendizaje.
Pero hay una segunda razón del fracaso de muchos esfuerzos de renovación curricular, que se relaciona también con la evaluación. Como ha mostrado Cronin-Jones (1991), los diseñadores de currículos no suelen tener en cuenta la fuerte influencia de las concepciones de los profesores en el proceso de implementación curricular. Lo mismo ocurre a menudo, en nuestra opinión, en los programas de formación del profesorado. Dicho de otra manera, para emprender un replanteamiento global de la enseñanza de las ciencias se precisa cuestionar preconcepciones docentes cuya importancia en la actividad del profesorado puede ser tan relevante o más que las preconcepciones de los alumnos en el aprendizaje de las ciencias (Hewson y Hewson, 1987). En efecto, comienza hoy a comprenderse que los profesores tienen ideas, actitudes y comportamientos sobre la enseñanza debidos a una larga formación "ambiental", en particular durante el periodo en que fueron alumnos, que ejerce una notable influencia por responder a experiencias reiteradas y adquirirse de forma no reflexiva, como algo natural, obvio, "de sentido común", escapando así a la crítica y convirtiéndose, insistimos, en un verdadero obstáculo. Y cabe sospechar que la evaluación sea uno de los aspectos de la actividad docente más afectado por estas preconcepciones (Gil et al 1991; Alonso, Gil y Mtnez-Torregrosa 1992).
Nos encontramos, pues, con dos poderosas razones para abordar el estudio de la evaluación y, para comenzar, el de las posibles preconcepciones docentes que pueden estar obstaculizando su renovación. Es preciso tener en cuenta, a este respecto, otra de las causas que suelen dificultar la apropiación de los nuevos conocimientos didácticos por los profesores: nos referimos a la escasa efectividad de transmitir al profesorado las propuestas de los expertos para su mera aplicación. Como ha indicado Briscoe (1991), es necesario que los profesores participemos en la construcción de los nuevos conocimientos didácticos abordando los problemas que la enseñanza nos plantea. Es así como podrá tener lugar la transformación de nuestras concepciones espontáneas. Convine señalar a este respecto que, si bien estas preconcepciones son muy abundantes y constituyen serios obstáculos (en la medida en que son aceptadas acríticamente), no resulta difícil generar una reflexión descondicionadora que ponga en cuestión estas "evidencias" y contribuya al trabajo de profundización necesario para su superación, aproximando las concepciones del profesorado a las adquisiciones de la investigación didáctica. Esto es lo que trataremos de mostrar en este taller que será planteado como una investigación dirigida en torno a las concepciones docentes en este campo.

1. Análisis crítico de las concepciones docentes sobre la evaluación y la práctica que se deriva

A.2. Considerar, a título de hipótesis, posibles preconcepciones que los profesores de ciencias podamos tener acerca de la evaluación y que convenga analizar para no quedar prisioneros de posibles ideas, comportamientos o actitudes incorrectas, asumidas acríticamente.

A.3. Cotejar el producto de la actividad anterior con las concepciones que se recogen en el documento anexo (Documento A), fruto de un trabajo de reflexión crítica en el que han colaborado centenares de profesores.

A.4. Comentad cuál de las preconcepciones docentes que hemos conjeturado, a propósito de la evaluación, os parece más preocupante, explicando brevemente las razones.

C.2, C.3 y C.4 Al proponer la actividad A.2 explicamos que hemos procedido a un análisis de la literatura con objeto de recopilar las concepciones-obstáculo estudiadas por distintos autores y manifestamos nuestro convencimiento (a modo de hipótesis que ellos mismos podrán contrastar) de que entre todos los equipos van a referirse a la casi totalidad de las mismas. Enunciamos esa hipótesis por dos razones fundamentales: en primer lugar porque ello va a ser un buen ejemplo (que se repetirá a lo largo del taller) de cómo al adoptar una actitud investigadora, los profesores elaboramos colectivamente productos de indudable calidad (aunque necesariamente embrionarios) que son coherentes con las aportaciones de la investigación didáctica. Ello vendría a mostrar que las preconcepciones del profesorado no constituyen un obstáculo insalvable, sino el fruto de una impregnación ambiental asumida como “natural” por no haber tenido ocasión de someterla a un análisis crítico. La auténtica dificultad estaría en una formación del profesorado que no proporciona estas ocasiones de reflexión crítica de “lo que siempre se ha hecho”. Como ellos podrán constatar, si se facilita esa reflexión crítica colectiva, si se coloca a los profesores en una situación de investigación dirigida, el resultado es francamente valioso.
En segundo lugar, el hecho de que cuando se plantea esta actividad grupos diversos de profesores lleguen a resultados muy similares (y básicamente coincidentes con los que se recogen en la literatura) da más valor a estas conjeturas, que no pueden ser vistas como meras “ocurrencias”. Pese a ello, conviene insistir en que se trata de meras conjeturas que será preciso someter a prueba posteriormente, tanto para ver en qué medida están extendidas, como para averiguar si constituyen realmente un obstáculo o son ideas y prácticas aceptables.
Para agilizar esta tarea de conjeturación proponemos a los equipos que escriban las distintas concepciones/obstáculo que puedan concebir, en unas octavillas que les proporcionamos (cada concepción en una octavilla). Quien dirige el taller puede así pasar por los distintos grupos y leer rápidamente las octavillas. De esta forma puede anotar las concepciones que van siendo señaladas hasta que la totalidad, o casi totalidad, de las recogidas en la literatura han sido señaladas. Naturalmente algunas concepciones aparecen repetidamente con distintos matices y formulaciones; otras tardan más en aparecer. Puede ser conveniente que el responsable del taller proporcione alguna retroalimentación estimulante, del tipo “¡La mayor parte de las concepciones conocidas han sido señaladas ya por uno o varios grupos!... Convendría ahora ‘mirar hacia otro lado’, pensar en algún otro aspecto de la evaluación...”.
El resultado de este proceso es que en un tiempo relativamente breve (tanto más breve, claro está, cuanto mayor es el número de equipos) suele haber referencias a la casi totalidad de las concepciones conocidas. La actividad A.3 está destinada a mostrar la coherencia de su trabajo con lo que muestra la investigación didáctica. Mediante una transparencia (que luego entregamos fotocopiada como “Documento A”) vamos mostrando las concepciones señaladas en la literatura, de forma que los equipos puedan indicar a cuáles de ellas han hecho referencia. Se trata de un conjunto de ideas, comportamientos y actitudes interrelacionados, que se apoyan mútuamente entre si y que podemos resumir en cinco apartados:
  1. La idea de que resulta fácil evaluar las materias de ciencias con objetividad y precisión, debido precisamente a la naturaleza misma de los conocimientos evaluados.
  2. La tendencia a limitar la evaluación a aquello que sea más fácilmente medible, evitando todo lo que pueda dar lugar a respuestas imprecisas. En asociación con la creencia en la objetividad de la evaluación, cabe esperar que se produzca un comportamiento tanto o más grave: limitar la práctica evaluadora a "lo más objetivo", es decir, a los conocimientos fácticos, a las leyes a través de ejercicios cerrados o de respuesta unívoca en los que no quepa la ambigüedad.
  3. La concepción determinista del aprendizaje de las ciencias, que supone que estas materias no están al alcance de todos y, en consecuencia, que una evaluación bien planteada pondrá de manifiesto el fracaso de un porcentaje importante de alumnos y discriminará a los "buenos alumnos" y a los "malos alumnos".
  4. Muy relacionada con la anterior, la tendencia autoexculpatoria consistente en achacar los altos porcentajes de fracaso en la evaluación a causas externas a la didáctica empleada. Los resultados negativos obtenidos a menudo por porcentajes elevados de alumnos son imputables a los propios o a la enseñanza... precedente.
  5. Finalmente, a modo de síntesis de las ideas y comportamientos anteriores, la tendencia a convertir la evaluación en un instrumento de mera constatación, de simple. Ello subyace, insistimos, en las ideas anteriores, pero tiene también sus implicaciones específicas (evaluación terminal, carácter de obstáculo a superar, actuación del profesor como “juez” y “policía”...).
El documento A resume este conjunto de posibles preconcepciones docentes acerca de la evaluación:

Documento A

Algunas preconcepciones y prácticas espontáneas

* Resulta fácil evaluar las materias científicas con objetividad y precisión.
* Se debe evaluar sólo lo más objetivo, evitando lo ambiguo.
* El fracaso de amplios porcentajes de estudiantes es inevitable (y responsabilidad de los propios estudiantes).
* También hay responsabilidad de la enseñanza... precedente.
* La evaluación es, fundamentalmente, un instrumento de constatación y de discriminación de únicamente los estudiantes, es decir, un instrumento de mera calificación.
Ello impone a su vez:
* poner el acento en pruebas terminales;
* carácter de obstáculo a superar;
* actuación del profesor como "juez" y "policía".
La actividad A.4 está planteada como tarea individual (a preparar, p.e., para el día siguiente) para que actúe de refuerzo. Al analizar los resultados puede constatarse que no hay ni una concepción que no sea señalada por algún profesor y que bastantes profesores se refieren a la imposibilidad de destacar alguna, puesto que todas les parecen muy relacionadas. Esto es algo que conviene comentar positivamente.
Conviene también insistir en que la existencia de estas concepciones y su naturaleza de obstáculo constituye una conjetura (apoyada, sin duda, por la reflexión crítica de lo que suele hacerse, por la coincidencia de distintos colectivos, etc.) que debe ser sometida a un cuidadoso análisis, para estimar en qué medida dichas preconcepciones están extendidas y para poner a prueba su validez. Se trata, pues, de continuar la investigación de las distintas concepciones conjeturadas.

A.5. Cabe suponer, a título de hipótesis, que los profesores de ciencias podemos pensar que “resulta fácil evaluar las materias científicas con objetividad y precisión, dada la naturaleza misma de los conocimientos evaluados”. Conviene, en primer lugar, aportar indicios (observaciones cualitativas, etc.) que apoyen la posible existencia de esta concepción.

A.6.Proponed algunos diseños experimentales para poner a prueba, de una forma más rigurosa, la supuesta objetividad y precisión de la evaluación del aprendizaje de las materias científicas.

A.7. Analizad algunos de los resultados obtenidos con dichos diseños. ¿Qué conclusiones se alcanzan?

C.5., C.6 y C.7. Con estas tres actividades pretendemos que los profesores profundicen, con una actitud investigativa, en una de las preconcepciones más comunes y más insidiosas de los profesores de ciencias en torno a la evaluación.
La actividad A.5 facilita una aproximación cualitativa a prácticas de evaluación que ponen en evidencia la creencia común de que “resulta fácil evaluar las materias científicas con objetividad y precisión, dada la naturaleza misma de los conocimientos evaluados”. Los equipos se refieren a hechos como la seguridad con que se procede a atribuir calificaciones numéricas “con decimales, tipo 4.75 o 6.25” y a la resistencia que solemos mostrar a modificar dichas calificaciones (como si realmente no hubiera margen alguno de imprecisión).
En respuesta a los diseños que se piden en la actividad A.6, para poner a prueba la supuesta objetividad y precisión de las evaluaciones, la primera idea que surge habitualmente es dar a corregir un mismo examen a diversos profesores. Este es un diseño clásico que ya fue utilizado por Hoyat (1960) con ejercicios de Física del Bachillerato francés. Conviene, pues, valorar positivamente esta propuesta y proporcionar algunos resultados para que procedan a su análisis. Puede recordarse así que Hoyat encontró que un mismo ejercicio de Física era calificado con notas que iban de 2 a 8 (¡).
Este diseño se ha utilizado numerosas veces con resultados similares; sin embargo, ello no nos permite concluir que queda probada la falta de objetividad y precisión. Como algunos equipos señalan, estas discrepancias en las notas pueden ser, simplemente, el fruto de distintos criterios (“Hay profesores rigurosos, otros con manga ancha...”). Surge así la idea de este otro diseño: hacer corregir de nuevo el mismo examen, al cabo de un cierto tiempo, a los mismos profesores. También este diseño fue ya utilizado por Hoyat, con resultados que mostraban una fuerte dispersión de las notas dadas por los mismos profesores.
Surge también la idea de esta otra variante: incluir dos o tres copias formalmente distintas (letras diferentes, modificación del orden de respuesta de las preguntas...) en aquellos casos en que los profesores tienen que corregir un número elevado de exámenes. Y de nuevo aparece una gran dispersión de las notas dadas a un mismo examen.
Algún equipo sugiere un diseño más sofisticado, destinado a ver cómo influyen las expectativas del profesor. Nosotros hemos utilizado reiteradamente un diseño de este tipo, consistente en plantear con profesores en activo y en formación la siguiente actividad: En el contexto de un seminario acerca de la evaluación, se propone a cada profesor la valoración de un breve ejercicio pidiéndole una puntuación entre 0 y 10 y, sobre todo, comentarios que puedan ayudar al alumno a comprender mejor la cuestión planteada. El ejercicio que se entrega para corregir es siempre el mismo, con la “única” diferencia de un pequeño texto introductorio, que en la mitad de las copias atribuye el ejercicio a un alumno "brillante" y en la otra mitad a un alumno "que no va demasiado bien". Este pequeño comentario, sin embargo, provoca diferencias en las medias del orden de 2 puntos (¡) (Aguilà, Farrús, Gil y González 1988; Alonso, Gil y Mtnez-Torregrosa 1992).
Una investigación similar, destinada a mostrar el sexismo del profesorado de Física, fue realizada por Spears (1984) y consistió en proponer la corrección de un examen a unos 300 profesores de Enseñanza Media con objeto de que evaluaran toda una serie de aspectos: nivel, precisión científica, capacidad para proseguir estudios científicos,.. Cada copia del examen fue presentada al 50% de los profesores con la firma de un alumno y al otro con la firma de una alumna. Los resultados mostraron que cada uno de los 14 aspectos a evaluar el "muchacho" fue calificado por encima de la "muchacha" (¡) con diferencias estadísticamente significativas.
Conviene recordar aquí la célebre experiencia de “Pigmalión a la Escuela” (Rosenthal y Jacobson 1968): en una serie de escuelas se hizo creer a los profesores que un test de inteligencia había detectado que un determinado alumno (elegido en realidad al azar) tenía un cociente intelectual extraordinario, era una especie de “diamante en bruto”. Dos años después se pudo constatar que los alumnos señalados habían experimentado un desarrollo intelectual muy superior al de sus condiscípulos.
Como vemos, todos estos resultados cuestionan la supuesta objetividad y precisión de la evaluación en un doble sentido: Por una parte muestran hasta qué punto las valoraciones habituales están sometidas a amplísimos márgenes de incertidumbre (aunque los profesores acostumbran a escribir notas como 4.75 y creer en su validez e inmodificabilidad, como si todo lo que han aprendido sobre márgenes de imprecisión, reproductibilidad de resultados, etc., dejara de ser válido cuando se trata de evaluar) y, por otra parte, hacen ver que la evaluación constituye un instrumento que afecta muy decisivamente a aquello que se pretende medir con ella, es decir, al propio proceso evaluado Dicho de otro modo, los profesores no sólo nos equivocamos al calificar (dando, p.e., puntuaciones mas bajas en materias como la Física a ejercicios que creemos hechos por las chicas), sino que contribuimos a que nuestros prejuicios -los prejuicios, en definitiva, de toda la sociedad- se conviertan en realidad: las chicas acaban teniendo logros inferiores y actitudes más negativas hacia el aprendizaje de la Física que los chicos y los alumnos considerados mediocres terminarán siéndolo. La evaluación resulta ser, más que la medida objetiva y precisa de unos logros, las expresión de unas expectativas en gran medida subjetivas pero con una gran influencia sobre los alumnos y los propios profesores.
Pese a los resultados anteriores, es posible seguir apostando por la objetividad y pensar que el problema está en “evitar evaluar lo que puede dar lugar a respuestas imprecisas que dificulten la necesaria objetividad”. Ésta podría ser contemplada, siempre a título de hipótesis, como una nueva concepción estrechamente ligada a la anterior y que conviene analizar también cuidadosamente:

A.8. Conjeturad cuáles podrían ser las implicaciones de una preconcepción consistente en “evitar evaluar lo que puede dar lugar a respuestas imprecisas”.

A.9. ¿Cómo podrían ponerse a prueba la(s) conjetura(s) enunciada(s) en la actividad anterior?

C.8 y C.9. Todos los equipos señalan el peligro de reduccionismo, de dejar de lado aspectos clave de la actividad científica, que entraña la búsqueda de máxima objetividad. Como refuerzo de esta correcta intuición se puede proporcionar, p.e.., la reseña de un artículo de Hodson (1992) en el que advierte de cómo la preocupación obsesiva por evitar la ambigüedad y asegurar la fiabilidad de las evaluaciones, distorsiona la naturaleza misma del trabajo científico, esencialmente difuso, incierto, intuitivo. La evaluación, señala Hodson, debería tener en cuenta dicha ambigüedad, no intentar eliminarla. En el mismo sentido se pronuncia Tamir (1998) criticando las pruebas objetivas.
Pero no se trata únicamente de tener en cuenta opiniones cualificadas. La actividad A.9 plantea la confección de diseños para una contrastación experimental de la hipótesis. Los equipos sugieren analizar el contenido de las pruebas oficiales y/o de varios profesores. Es conveniente insistir en la necesidad de una pluralidad de diseños y, en particular, de pensar en diseños que no plantean excesivas dificultades (no es fácil, p.e., conseguir un número suficiente de exámenes de distintos profesores). Surge así la idea de otro diseño consistente en pedir a los profesores que critiquen un examen habitual para ver en qué medida detectan sus limitaciones.
Para realizar los análisis que los diseños propuestos conllevan es preciso clarificar previamente qué se considera conveniente evaluar. De este modo se produce un cambio fundamental de pregunta: en vez de “¿cómo conseguir que la evaluación sea objetiva?”, la cuestión pasa a ser “¿cómo conseguir que la evaluación refleje aquello que se considera importante?”. Pero tener claro aquello que se considera importante en la educación científica (y que, por tanto, debiera estar presente en la evaluación) no es algo obvio a lo que se pueda responder automáticamente, sino que responde a una cierta concepción de la ciencia y de su enseñanza. Convine, pues, realizar un esfuerzo explícito para evitar visiones reduccionistas, empobrecedoras, de la actividad científica. Proponemos para ello la siguiente actividad:

A.10. Recordad cuáles pueden ser las concepciones erróneas sobre el trabajo científico a las que la enseñanza de las ciencias debe prestar atención, evitando su transmisión explícita o implícita (a través, p.e., de aquello que se evalúa).

C.10. Esta es una actividad que consideramos fundamental para un planteamiento correcto del proceso de enseñanza/aprendizaje de las ciencias, no sólo para la evaluación. Nos remitimos a otros trabajos (Gil 1993, 1996 y 1997) en los que hemos abordado el problema de las concepciones docentes “espontáneas” sobre la ciencia como obstáculo para la renovación de la enseñanza de las ciencias. Aquí señalaremos únicamente que una discusión de una cierta profundidad de las posibles deformaciones permite a los profesores cuestionar el habitual reduccionismo de la evaluación y de la misma enseñanza. Esta discusión –que fue realizada en el segundo módulo del periodo presencial- permitó sacar a la luz las deformaciones que se enumeran a continuación (todas ellas estrechamente ligadas entre sí):

Posibles visiones deformadas acerca de la ciencia

** Visión empirista y ateórica: Se resalta el papel de la observación y de la experimentación "neutras" (no contaminadas por ideas apriorísticas"), olvidando el papel esencial de las hipótesis y de la construcción de un cuerpo coherente de conocimientos (teoría).

Por otra parte, pese a esta importancia dada (verbalmente) a la observación y experimentación, en general la enseñanza es puramente libresca, sin apenas trabajo experimental. Ello favorece que la experimentación conserve para profesores y alumnos el atractivo de una "revolución pendiente".

Se incide particularmente en esta visión ateórica cuando se presenta el aprendizaje de la ciencia como una cuestión de "descubrimiento" o se reduce a la práctica de "los procesos" con olvido de los contenidos.

** Visión rígida (algorítmica, "exacta", infalible...): Se presenta el "Método Científico" como conjunto de etapas a seguir mecánicamente. Se resalta, por otra parte, lo que supone tratamiento cuantitativo, control riguroso, etc, olvidando -o, incluso, rechazando- todo lo que significa invención, creatividad, duda...

En el polo opuesto de esta visión rígida y dogmática de la ciencia como descubridora de "la verdad contenida en los hechos", se presenta un relativismo extremo, tanto metodológico ("todo vale", no hay estrategias específicas en el trabajo científico) como conceptual (no hay una realidad objetiva que permita contrastar la validez de las construcciones científicas: la única base en la que se apoya el conocimiento es el consenso de la comunidad de investigadores en ese campo).

** Visión aproblemática y ahistórica (ergo dogmática): Se transmiten conocimientos ya elaborados, sin mostrar cuáles fueron los problemas que generaron su construcción, cuál ha sido su evolución, las dificultades, etc, ni mucho menos aún, las limitaciones del conocimiento actual o las perspectivas abiertas.

** Visión exclusivamente analítica, que resalta la necesaria parcialización de los estudios, su carácter acotado, simplificatorio, pero que olvida los esfuerzos posteriores de unificación y de construcción de cuerpos coherentes de conocimientos cada vez más amplios, el tratamiento de problemas "frontera" entre distintos dominios que pueden llegar a unirse, etc.

Contra esta visión parcializada, se han elaborado propuestas de enseñanza integrada de las ciencias que toman la unidad de la materia como punto de partida, olvidando que el establecimiento de dicha unidad constituye una conquista reciente y nada fácil de la ciencia. Recordemos, p.e., la fuerte oposición a las concepciones unitarias en Astronomía (heliocentrismo), en Biología (evolucionismo) o en Química Orgánica (síntesis orgánica).

** Visión acumulativa, lineal: Los conocimientos aparecen como fruto de un crecimiento lineal, ignorando las crisis, las remodelaciones profundas. Se ignora, en particular, la discontinuidad radical entre el tratamiento científico de los problemas y el pensamiento ordinario.

** Visión individualista: Los conocimientos científicos aparecen como obra de genios aislados, ignorándose el papel del trabajo colectivo, de los intercambios entre equipos... Se deja creer, en particular, que los resultados de un sólo científico o equipo pueden verificar o falsar una hipótesis.

Esta visión individualista se presenta, a menudo, asociada con concepciones elitistas:

** Visión "velada", elitista: Se presenta el trabajo científico como un dominio reservado a minorías especialmente dotadas, transmitiendo expectativas negativas hacia la mayoría de los alumnos, con claras discriminaciones de naturaleza social y sexual (la ciencia es presentada como una actividad eminentemente "masculina"). Se contribuye a este elitismo escondiendo la significación de los conocimientos tras el aparato matemático. No se realiza un esfuerzo por hacer la ciencia accesible (comenzando con tratamientos cualitativos, significativos), ni por mostrar su carácter de construcción humana, en la que no faltan confusiones ni errores... como los de los propios alumnos.

En el polo opuesto nos encontramos con una Visión de "sentido común": Los conocimientos se presentan como claros, obvios, "de sentido común", olvidando que la construcción científica parte, precisamente, del cuestionamiento sistemático de lo obvio.

** Visión descontextualizada, socialmente neutra: Se olvidan las complejas relaciones C/T/S y se proporciona una imagen de los científicos como seres "por encima del bien y del mal", encerrados en torres de marfil y ajenos a las necesarias tomas de decisión. Como reacción puede caerse en una visión excesivamente sociologista de la ciencia que diluye completamente su especificidad, así como en planteamientos muy simplistas: exaltación de la ciencia como factor absoluto de progreso o rechazo sistemático (a causa de su capacidad destructiva, efectos contaminantes, etc).

Una vez discutidas las posibles deformaciones podemos plantearnos cuáles son los aspectos del aprendizaje de las ciencias que debieran ser evaluados para evitar visiones empobrecidas que dejen de lado características esenciales de la actividad científica:

A.11. Enumerad aquellos aspectos de la actividad de los estudiantes que deberían ser evaluados, pero a los que las pruebas de evaluación ordinarias pueden no prestar la debida atención. Se propone para ello la construcción de una red de análisis cuyos items correspondan a aquellos aspectos cuya presencia o ausencia queremos determinar en las pruebas de evaluación habituales.

C.11. La cuidadosa elaboración de una red de análisis que contemple aquello que debe ser evaluado resulta esencial, insistimos, para evitar reduccionismos empobrecedores y ha de enfrentarse a tradiciones que sistemáticamente han limitado la evaluación a los aspectos más fáciles de medir. La discusión realizada de las posibles deformaciones permite a los grupos romper con dichas tradiciones e incluir toda una pluralidad de aspectos que caracterizan al trabajo científico como una actividad abierta y creativa. Como refuerzo de sus aportaciones se puede proporcionar una red de análisis como la siguiente, en la que pueden ver reflejadas muchas de sus propuestas:
Análisis de la presencia de actividades de evaluación coherentes con las estrategias de construcción de conocimientos científicos
1. ¿Se incluyen situaciones problemáticas abiertas de un nivel de dificultad adecuado (correspondiente a su zona de desarrollo potencial)?
2. ¿Se piden reflexiones sobre el posible interés de las situaciones propuestas que den sentido a su estudio (considerando las posibles implicaciones CTS, etc.)?
3. ¿Se piden análisis cualitativos, significativos, que ayuden a comprender y a acotar las situaciones planteadas (a la luz de los conocimientos disponibles, del interés del problema...) y a formular preguntas operativas sobre lo que se busca?

¿Se potencia y valora, por otra parte, el papel esencial de las matemáticas como instrumento de investigación, que interviene desde la formulación misma de problemas al análisis de los resultados, sin caer en operativismos ciegos?

4. ¿Se pide la emisión de hipótesis, fundamentadas en los conocimientos disponibles, susceptibles de orientar el tratamiento de las situaciones y de hacer explícitas, funcionalmente, las preconcepciones?
¿Se plantea, al menos, el manejo o el análisis crítico de algunas hipótesis?
¿Se incluyen actividades que supongan atención a las preconcepciones, contempladas como hipótesis?
5. ¿Se plantea la elaboración de estrategias (en plural) incluyendo, en su caso, diseños experimentales?
¿Se pide, al menos, la evaluación crítica de algún diseño?
¿Se presta atención a la actividad práctica en sí misma (montajes, medidas...)?
¿Se presta atención, en particular, al manejo de la tecnología actual (ordenadores, electrónica, automación...) con objeto de favorecer una visión más correcta de la actividad científico-tecnológica contemporánea?
6. ¿Se piden análisis detenidos de resultados (su interpretación física, fiabilidad...) a la luz del cuerpo de conocimientos disponible, de las hipótesis manejadas, de los resultados de otros autores...?
¿Se pide, en particular, el análisis de posibles conflictos entre algunos resultados y las concepciones iniciales (expresión, a menudo, del “sentido común”?
¿Se favorece la “autorregulación” del trabajo de los estudiantes (proporcionando, p.e., indicadores que les permitan comprobar que van, o no, en una dirección correcta?
7. ¿Se pide la consideración de posibles perspectivas (replanteamiento del estudio a otro nivel de complejidad, problemas derivados...)?
¿Se incluyen, en particular, actividades relativas a implicaciones CTS (aplicaciones, repercusiones negativas...)?
¿Se valoran los “productos” elaborados por los estudiantes (carteles, instrumentos...)?
8. ¿Se piden esfuerzos de integración que consideren la contribución de los estudios realizados a la construcción de un cuerpo coherente de conocimientos, las posibles implicaciones en otros campos de conocimientos, etc.?
¿Se pide algún trabajo de construcción de síntesis, mapas conceptuales, etc., que ponga en relación conocimientos diversos?
9. ¿Se presta la debida atención a la comunicación?
¿Se plantea la elaboración de memorias científicas (o fragmentos)?
¿Se pide la lectura y comentario crítico de textos científicos?
¿Se presta atención a la verbalización, solicitando comentarios significativos que eviten el “operativismo mudo”?
¿Se hace un seguimiento cuidadoso del dossier de los alumnos como memoria ordenada del trabajo realizado?
10. ¿Se potencia en la evaluación la dimensión colectiva del trabajo científico, valorando los trabajos realizados en equipo, el funcionamiento de los grupos de trabajo, etc?
¿Se favorece la “inter-regulación” de los equipos?
¿Se permite (y potencia) el manejo funcional del cuerpo de conocimientos aceptado por la comunidad científica (sin exigir memorizaciones irracionales)? ¿Se presta atención, en ese sentido, a que los prerrequisitos no se conviertan en obstáculo para las tareas propuestas?
Pese a que entre todos los equipos se suele hacer referencia a la casi totalidad de los aspectos incluidos en una red como la anterior, merece la pena detenerse en la discusión de la misma, y en analizar los olvidos más sistemáticos, proponiendo para ello la siguiente actividad:

A.12. Comparad las actividades de evaluación contempladas en vuestro equipo y las que incluye la red de análisis elaborada colectivamente y comentad brevemente el resultado de dicha comparación.

Cabe ahora analizar, utilizando instrumentos como el elaborado en la actividad anterior, en qué medida las pruebas de evaluación habituales suelen contemplar los aspectos fundamentales en una educación científica, o se incurre, como hemos supuesto, en graves reduccionismos. Las actividades A.13, A.14 y A.15 están destinadas a este análisis, utilizando los diseños y red de análisis elaborados, así como información obtenida en diversas investigaciones (Alonso Gil y Mtnez-Torregrosa 1992, 1992b y 1995).

C.13, C.14 y C.15. Para no recargar excesivamente este texto omitimos aquí la formulación detallada de dichas actividades, que incluyen el manejo de abundante información (que es distribuida a los equipos en forma de fotocopias y que puede consultarse en los artículos mencionados). Digamos simplemente que los análisis realizados de los exámenes habituales diseñados por los profesores y de las pruebas externas (como las Pruebas de Acceso a la Universidad) apoyan plenamente la hipótesis de un grave reduccionismo, reforzando la comprensión de que la búsqueda de máxima objetividad y precisión puede derivar (ha derivado) en un peligroso empobrecimiento de la educación científica.

Una posible justificación del reduccionismo de las pruebas de evaluación sería el intento de evitar la introducción de aspectos “demasiado complicados”. De hecho, una posible concepción a la que nos hemos referido, siempre a título de hipótesis, es que “el fracaso de un número elevado de alumnos es inevitable en materias rigurosas como las ciencias, que no están al alcance de todos”. Para analizar la extensión de dicha concepción se ha concebido, entre otros, el diseño que se describe en la siguiente actividad:

A.16. Se plantea a una serie de profesores la siguiente cuestión: “Las gráficas adjuntas presentan posibles distribuciones de las notas obtenidas en una prueba por los estudiantes de una clase. Señalad cuál de dichas distribuciones es más correcta y por qué”.

Comentad qué resultados cabe esperar, es decir, indicar cuál de las opciones a), b), c) puede parecer más correcta a la mayoría de los profesores y las razones que pueden aducir para ello.

C.16. Todos los equipos coinciden en predecir que la mayoría de los profesores optarán por las gráficas a o b, lo que supone que, en el mejor de los casos, se considera correcto un fracaso del 50% de los estudiantes (¡). Esto es lo que sucede en realidad como han mostrado diversas investigaciones (Alonso, Gil y Mtnez-Torregrosa 1992). Si tenemos en cuenta, por otra parte, la influencia de las expectativas del profesor en los resultados de la evaluación y del aprendizaje, se comprende la gravedad de esta predisposición al fracaso generalizado de los estudiantes.

En ocasiones, los resultados negativos obtenidos por porcentajes elevados de estudiantes son imputados también a la enseñanza... precedente.

A.17. En entrevistas realizadas a profesores de facultades de ciencias, la causa de fracaso más mencionada fue “la falta de base de los estudiantes, debida a las insuficiencias de la formación proporcionada en los niveles precedentes”. Para apoyar esta tesis, unos profesores universitarios pasaron, el primer día de clase, a los estudiantes que habían ingresado en la facultad de Química, un sencillo test con 20 cuestiones consideradas muy elementales por los mismos profesores de Secundaria. Los resultados fueron realmente decepcionantes lo que, en opinión de los autores del test, constituía la prueba de la incorrecta preparación proporcionada a dichos estudiantes.

Suponiendo que no aceptemos, por demasiado simplista, la interpretación dada a la experiencia descrita en el párrafo anterior ¿qué diseños podríamos concebir para mostrar lo incorrecto de dicha interpretación?

A.18. Analizad los resultados obtenidos mediante alguno de los diseños concebidos en A.17.

C.17 y C.18. Un diseño que los equipos proponen frecuentemente para cuestionar la idea simplista de que el fracaso de los estudiantes universitarios es debido fundamentalmente a su “falta de base”, consiste en pasar el mismo test que se pasó a los estudiantes de primer curso (en su primer día de clase), a los estudiantes que llegan a segundo (con una valoración positiva por parte de sus profesores universitarios), también el primer día de clase. Esta experiencia ha sido realizada con estudiantes de las facultades de Química y de Física (Calatayud, Gil y Gimeno, 1992) y los resultados obtenidos muestran una gran similitud entre los niveles de acierto de ambos colectivos (sin diferencias significativas en la generalidad de los items), poniendo así en cuestión la tesis simplista que sólo responsabiliza a la enseñanza precedente. Una vez más se muestra de este modo el peligro que suponen ciertas concepciones del profesorado (y en realidad de toda la sociedad) acerca, entre otros, de la evaluación.

Las concepciones sobre la evaluación que hemos venido contemplando no constituyen ideas o comportamientos inconexos y proporcionan una idea de evaluación como instrumento de constatación y discriminación de los estudiantes, es decir, como simple calificación.

A.19. ¿Qué consecuencias suele conllevar la identificación de la evaluación con la mera calificación? (Indicad algún indicio de las consecuencias que se señalen).

C.19. Los equipos se refieren una vez más al carácter de obstáculo a superar que adquieren las pruebas (con tiempos rígidamente limitados, clima de tensión, etc.), al papel de juez frío y distante y de policía vigilante que ha de asumir el profesor, a la reducción de las evaluaciones a las pruebas terminales, etc. Resulta bastante fácil señalar algunos indicios que apoyan esta visión de la evaluación, pero no consideramos necesario detenernos más en el análisis crítico de las concepciones docentes “espontáneas” (es decir, asumidas acríticamente por impregnación) acerca de la evaluación. Un análisis crítico que pueden sin duda, ser profundizado, pero que ha mostrado ya, pensamos, las limitaciones de la práctica evaluativa habitual, haciendo ver la necesidad de un replanteamiento global de la evaluación.

2. Replanteamiento de la evaluación

Con objeto de romper con las limitaciones de las concepciones espontáneas que acabamos de analizar someramente, conviene proceder a un replanteamiento global de la evaluación que no dé nada por sentado y clarifique todos sus aspectos, comenzando por reflexionar acerca de para qué evaluar:

A.20. Si no se puede aceptar la idea de una evaluación como juicio objetivo y terminal de la tarea realizada por cada alumno... ¿Cuáles habrían de ser las funciones de la evaluación?

C.20. El análisis crítico realizado hasta aquí ha permitido a los equipos comprender que carece de sentido una evaluación consistente en el enjuiciamiento "objetivo" y terminal de la labor realizada por cada alumno. Por el contrario, el profesor ha de considerarse corresponsable de los resultados que éstos obtengan: no puede situarse frente a ellos, sino con ellos; su pregunta no puede ser "quien merece una valoración positiva y quien no", sino "qué ayudas precisa cada cual para seguir avanzando y alcanzar los logros deseados". Para ello son necesarios un seguimiento atento y una retroalimentación constante que reoriente e impulse la tarea. Eso es lo que ocurre en los equipos de investigación que funcionan correctamente y eso es lo que tiene sentido también, en nuestra opinión, en una situación de aprendizaje orientada a la construcción de conocimientos, a la investigación. Los estudiantes han de poder cotejar sus producciones con las de otros equipos y -a través del profesor/ director de investigaciones- con el resto de la comunidad científica; y han de ver valorado su trabajo y recibir la ayuda necesaria para seguir avanzando, o para rectificar si necesario.
La evaluación se convierte así en un instrumento de aprendizaje, es decir, en una evaluación formativa, substituyendo a los juicios terminales sobre los logros y capacidades de los estudiantes. Pero, aunque ello representa un indudable progreso, éste resulta insuficiente si no se contempla también como un instrumento de mejora de la enseñanza. En efecto, las disfunciones en el proceso de enseñanza/ aprendizaje no pueden atribuirse exclusivamente a dificultades de los estudiantes y resultará difícil que los alumnos y alumnas no vean en la evaluación un ejercicio de poder externo (y, por tanto, difícilmente aceptable) si sólo se cuestiona su actividad.
Si realmente se pretende hacer de la evaluación un instrumento de seguimiento y mejora del proceso, es preciso no olvidar que se trata de una actividad colectiva, de un proceso de enseñanza/ aprendizaje en el que el papel del profesor y el funcionamiento del centro constituyen factores determinantes. La evaluación ha de permitir, pues, incidir en los comportamientos y actitudes del profesorado. Ello supone que los estudiantes tengan ocasión de discutir aspectos como el ritmo que el profesor imprime al trabajo o la manera de dirigirse a ellos. Y es preciso evaluar también el propio currículo, con vistas a ajustarlo a lo que puede ser trabajado con interés y provecho por los alumnos y alumnas. De esta forma los estudiantes aceptarán mucho mejor la necesidad de la evaluación que aparecerá realmente como un instrumento de mejora de la actividad colectiva.
Las funciones de la evaluación pueden resumirse, pues, y así son señaladas ahora por los equipos, en:
Nos centraremos, en primer lugar, en el papel de la evaluación como instrumento de aprendizaje, aunque insistimos en la necesidad de romper con los reduccionismos habituales, extendiendo la evaluación a la actividad del profesorado y al mismo currículo (Rodríguez et al 1992; Imbernon 1990; Porlán 1993; Santos 1993...).

2.1. La evaluación como instrumento de aprendizaje

A.21. ¿Cuáles habrían de ser las características de la evaluación para que se convierta en un instrumento de aprendizaje?

Comentarios A.21. Conseguir que la evaluación constituya un instrumento de aprendizaje, se convierta en una evaluación formativa, supone dotarla de unas características que rompan con las concepciones de sentido común que hemos analizado someramente en el primer apartado. Resumiremos a continuación la discusión de dichas características propiciada por la actividad A.21.

A.22. ¿En qué medida pueden resultar perjudicados los buenos estudiantes por una evaluación con las características propuestas?

C.22. Algunos profesores pueden pensar, en efecto, que una retroalimentación constante, un ritmo inicial pausado, etc., ha de traducirse en pérdidas de tiempo que perjudicarán a los estudiantes bien preparados cuyo derecho a aprender no debe ser ignorado. Pero, en realidad, lo que sucede es todo lo contrario: esta aparente pérdida de tiempo inicial permite romper con la rémora que supone a lo largo del curso la existencia de un núcleo importante de alumnos que "no siguen". Se produce así un progreso global, favorable también para los alumnos mejor preparados. Todo esto, por supuesto, debe ser explicitado para evitar inquietudes y tensiones innecesarias y transmitir, en definitiva, expectativas positivas a todos los alumnos.

Vistas las características fundamentales que una evaluación habría de poseer para convertirse en un instrumento eficaz de aprendizaje, conviene ahora detenerse en considerar las formas concretas de realizar dicha evaluación:

A.23. Sugerir formas concretas de realizar la evaluación que permitan incidir positivamente en el aprendizaje de las ciencias.

A.24. Considerad, en particular, los pros y contras del examen como forma de evaluación.

C.23 y C.24 Cabe decir, en primer lugar, que una orientación constructivista del aprendizaje permite que cada actividad realizada en clase por los alumnos constituya una ocasión para el seguimiento de su trabajo, la detección de las dificultades que se presentan, los progresos realizados, etc., etc. Es ésta una forma de evaluación extraordinariamente eficaz para incidir "sobre la marcha" en el proceso de aprendizaje, que se produce además en un contexto de trabajo colectivo, sin la distorsión de la ansiedad que produce una prueba individual. Ello no elimina, sin embargo, la necesidad de actividades de evaluación individuales que permitan constatar el resultado de la acción educativa en cada uno de los estudiantes y obtener información para reorientar convenientemente su aprendizaje. A tal efecto consideramos muy conveniente la realización de alguna pequeña prueba en la mayoría de las clases sobre algún aspecto clave de lo que se ha venido trabajando. Ello permite:
Conviene discutir inmediatamente las posibles respuestas a la actividad planteada, lo que permitirá conocer si la clase está o no preparada para seguir adelante con posibilidades de éxito. Se favorece así la participación de los alumnos en la valoración de sus propios ejercicios y en su autorregulación (Alonso, Gil y Mtnez-Torregrosa, 1995b). Se puede aprovechar también esta discusión -si se realiza al comienzo de una clase- como introducción al trabajo del día, centrando la atención de los estudiantes de una forma particularmente efectiva.
Pese al interés y efectividad de estas pequeñas pruebas, consideramos (y coincidimos en ello con la mayoría de los equipos) que los exámenes o pruebas más extensas siguen siendo necesarios. Es cierto que el examen es visto a menudo como simple instrumento de calificación de los estudiantes, siendo criticado a justo título por lo que supone de aleatoriedad, tensión bloqueadora, etc. (Gould, 1982); sin embargo un examen, o mejor dicho, una sesión de globalización, es también ocasión de que el alumno se enfrente con una tarea compleja y ponga en tensión todos sus conocimientos. Por nuestra parte, asumiendo la crítica al examen como instrumento exclusivo de calificación, queremos referirnos al papel de las sesiones de globalización como ocasión privilegiada de aprendizaje si se cumplen algunas condiciones:
En primer lugar es necesario que la sesión suponga la culminación de una revisión global de la materia considerada, incluyendo actividades coherentes con un aprendizaje por construcción de conocimientos: desde análisis cualitativos de situaciones abiertas al tratamiento de las relaciones ciencia/ técnica/ sociedad; desde la construcción y fundamentación de hipótesis -más allá de las evidencias de sentido común- a la interpretación de los resultados de un experimento, etc., etc. Es también necesario que las condiciones de realización de estas actividades globalizadoras sean compatibles con lo que supone una construcción de conocimientos -que conlleva tentativas, rectificaciones, etc.- y, en particular, que los estudiantes no se vean constreñidos por limitaciones de tiempo que sólo son compatibles con la simple regurgitación de conocimientos memorizados.
En segundo lugar, es muy conveniente que el producto elaborado por cada estudiante en estas sesiones sea devuelto comentado lo antes posible y que se discutan, cuestión por cuestión, las posibles respuestas, las contribuciones positivas y los errores aparecidos, la persistencia de preconcepciones, etc. Los estudiantes, con su producto delante, se mantienen abiertos y participativos como nunca durante estas revisiones, que constituyen actividades de autorregulación muy eficaces. Y es también conveniente, tras esta discusión, solicitar de los estudiantes que rehagan de nuevo la tarea en su casa con todo cuidado y vuelvan a entregarla. Ello contribuye muy eficazmente a afianzar lo aprendido, como puede constatarse en los días siguientes con la realización de pequeños ejercicios sobre los aspectos que hubieran planteado más dificultades.
No podemos detenernos aquí en una descripción detallada de cada uno de los momentos de evaluación a que nos acabamos de referir, ni entrar siquiera a tocar otros aspectos de importancia como, por ejemplo, el tipo de instrumentos destinados a la recogida de información (Geli, 1995). Insistiremos tan sólo, para terminar, en que los alumnos y alumnas han de ver debidamente valoradas todas sus realizaciones, todos sus productos colectivos o individuales -desde la construcción de un instrumento a, muy en particular, su cuaderno o dossier de clase- y no solamente aquellas planteadas como pruebas. Se incrementa así la información disponible para valorar y orientar adecuadamente el aprendizaje de los estudiantes y se contribuye a que estos vean reconocidos todos sus esfuerzos con el consiguiente efecto motivador. Se trata, en definitiva, de lograr una total confluencia entre las situaciones de aprendizaje y de evaluación (Pozo et al, 1992), explotando el potencial evaluador de las primeras y diseñando las segundas como verdaderas situaciones de aprendizaje. Es preciso también transformar los enunciados de las actividades de evaluación habituales para que pierdan su carácter de ejercicio memorístico o simplemente operativo y favorezcan una actividad más significativa:

A.25. Proceder a transformar algunas actividades extraídas de exámenes habituales, concibiendo otras más adecuadas. Proponer, en particular, alguna actividad que favorezca la autorregulación de los estudiantes.

C.25 La transformación de actividades de evaluación extraídas de exámenes habituales es una tarea atractiva para los profesores participantes que, tras las reflexiones realizadas hasta aquí, avanzan sin dificultades en el sentido de proponer actividades que favorezcan el aprendizaje con sentido, que permitan poner en juego lo que “de verdad” piensan los alumnos. Las propuestas son variadas y pertinentes, mostrando que basta un esfuerzo explícito de superar los planteamientos memorísticos habituales para lograr buenos resultados. (Alonso, Gil y Mtnez Torregrosa 1995b; Gil, Mtnez Torregrosa y Verdú 1999)
Se puede, por ejemplo, presentar directamente al estudiante una respuesta errónea, supuestamente perteneciente a otra persona pero que es muy probable que coincida con su propio pensamiento, y pedirle que la corrija. De esta forma se consigue que adopte una actitud de reflexión crítica y no se deje llevar por lo que parece obvio.
Por supuesto, otra forma de favorecer la auto-regulación de los estudiantes y, en definitiva, de lograr que sean conscientes de lo que se está tratando y por qué, qué se ha avanzado y lo que queda por avanzar, es proponer recapitulaciones problematizadas periódicas, construcción de mapas conceptuales, etc., y, muy en particular, la cuidadosa elaboración y revisión del cuaderno de trabajo o “portafolio” (Duschl, 1995)

El trabajo realizado hasta aquí nos ha permitido romper con la habitual identificación entre evaluación y calificación de los estudiantes. Cabe plantearse, sin embargo, si la calificación conserva alguna funcionalidad en la nueva propuesta evaluativa:

2.2. El papel de la calificación

A.26. Evaluar no es simplemente calificar, pero ¿qué idea de calificación puede derivarse de las finalidades y características de la evaluación discutidas hasta aquí?

C.26. El trabajo realizado hasta aquí nos ha permitido romper con la habitual identificación entre evaluación y calificación de los estudiantes, fundamentando una propuesta de evaluación como instrumento de mejora del aprendizaje, de la enseñanza y del propio currículo (aunque aquí nos hemos centrado en el primer aspecto). La cuestión a plantearse ahora es si la calificación conserva alguna funcionalidad en la nueva propuesta evaluativa y, en su caso, qué forma de calificación puede resultar coherente con dicha propuesta . Resumiremos, a continuación, el contenido del debate realizado a este respecto (Alonso, Gil y Mtnez-Torregrosa 1996).
Digamos, para empezar, que toda evaluación posee connotaciones valorativas, es decir, calificatorias: tanto al indicar la necesidad de profundizar o rectificar aspectos, como al aceptar el trabajo realizado sin enmiendas sustanciales, se está expresando implícitamente una valoración, aunque la función esencial no sea la valoración sino favorecer la mejora del producto. El o la estudiante puede percibir así lo más o menos cerca que se encuentra de haber conseguido un producto satisfactorio. La pregunta a formularse, pues, no es si debe haber o no valoración de la tarea, sino ¿es conveniente traducir las valoraciones que conlleva toda evaluación a calificaciones explícitas y normalizadas?.
Para contestar a esta pregunta comenzaremos considerando el papel de la calificación en la formación de los investigadores noveles, que es la situación en la que se inspira nuestro modelo constructivista de aprendizaje de las ciencias.
a) La calificación en la formación de los investigadores
Un mínimo análisis de las situaciones de formación de investigadores, como la que supone, p.e., la preparación de una tesis doctoral, permite constatar que la evaluación juega un papel fundamental (en forma de seguimiento constante de la labor del doctorando) pero que la calificación está prácticamente ausente a lo largo de todo el proceso de formación.
En efecto, la idea central que subyace en el compromiso del doctorando y del director de la investigación es que ambos son corresponsables de la tarea, ambos están comprometidos en lograr un producto satisfactorio. Las críticas y sugerencias del director no constituyen un enjuiciamiento externo sino una contribución interesada. Y como tal es percibida por el doctorando.
De hecho, durante todo el tiempo que dura la realización de la investigación no hay calificación alguna: sólo cuando el doctorando y el director consideran ambos que el producto es aceptable se somete a la valoración de otros investigadores. Pero incluso esto último ha ido, afortunadamente, evolucionando y se está generalizando la práctica de someter a los miembros del tribunal el borrador de la tesis con tiempo suficiente para que puedan expresar sus críticas y sugerencias y recogerlas en una nueva versión que cuente con su aceptación. De esta forma, la lectura de la tesis se convierte en un acto protocolario que sanciona un producto que cuenta ya con la aceptación del tribunal (que se ha implicado, si necesario, en la mejora del producto).
La calificación ha perdido así su función de enjuiciamiento externo y de sanción discriminatoria. De acuerdo con ello, las calificaciones habituales (aprobado, notable...) han sido sustituidas por un simple apto o no apto y constituyen rarísimas excepciones las tesis que no obtienen el apto "cum laude" que sanciona una investigación de calidad.
Lo esencial, pues, es garantizar que el producto obtenido sea satisfactorio. Ello puede obligar a prolongar el periodo de realización e incluso puede llevar a algunos doctorandos a abandonar la investigación a la vista de las dificultades encontradas o porque deciden orientar su actividad en otra dirección. Pero, en cualquier caso, ese abandono constituye una opción que, en general, no viene impuesta por unas valoraciones negativas, por un enjuiciamiento "neutral" de quien dirige el trabajo o de un tribunal.
En definitiva, en una situación de formación de investigadores, la calificación explícita no está presente a lo largo del proceso y no conserva otra funcionalidad que el reconocimiento del trabajo realizado... cuando éste posee suficiente calidad a los ojos del propio doctorando, del director de la tesis y de los miembros de un "tribunal" que constituye, más bien, una nueva instancia de revisión y ayuda, es decir, de evaluación como instrumento para la mejora del producto.
Ésta es, para nosotros, la mejor forma de plantear la evaluación y la calificación. Ahora bien, ¿en qué medida conviene o es posible hacer un planteamiento similar en una clase de ciencias de Educación Secundaria?
b) La calificación en la formación de los estudiantes de ciencias
En la medida en que nuestro modelo de aprendizaje de las ciencias como investigación se inspira en la metáfora de los estudiantes como "investigadores noveles" y del profesor como "experto", consideramos adecuado un planteamiento de la evaluación y de la calificación como el que acabamos de describir. Lo esencial, pues, es orientar la evaluación como ayuda para la consecución, en el tiempo que sea necesario, de los logros perseguidos y que la calificación suponga tan sólo el reconocimiento de dichos logros.
Ahora bien, es obvio que, en el caso de una clase de ciencias, el contacto del "director de la investigación" (profesor) con cada "investigador novel" (cada estudiante) no puede ser tan íntimo como el que se da en un equipo real de investigadores. Y es obvio también que los estudiantes no pueden centrarse en el trabajo de su clase de ciencias con la misma dedicación de un doctorando en su investigación. Ni puede pedirse a un adolescente la misma responsabilidad y capacidad de autorregulación que a un investigador real. Más aún, no es posible retrasar indefinidamente el momento de la valoración explícita del trabajo de los estudiantes, puesto que un curso dura nueve meses, al término de los cuales es preciso dar una calificación que indique la posibilidad o no de pasar a un nuevo nivel, etc.
Parece razonable, por todo ello, que la evaluación del trabajo de los estudiantes incluya indicaciones más explícitas y frecuentes del grado de consecución de los logros que se persiguen. Es decir, parece conveniente -y los mismos estudiantes lo reclaman- proporcionar valoraciones de las tareas que ayuden a los estudiantes a conocer si están progresando adecuadamente o no. Se trataría, en definitiva, de hacer explícitas las valoraciones que en los comentarios de una evaluación formativa aparecen ya implícitamente.
En resumen: la calificación puede ser conveniente -además de constituir una exigencia social difícilmente soslayable- como complemento de la evaluación formativa que hemos intentado fundamentar. Pero ello exige también una profunda modificación del uso y sentido de la calificación.
Este naturaleza de las calificaciones como indicaciones provisionales, destinadas a favorecer la autorregulación de los estudiantes, puede verse reforzada si se sustituyen las valoraciones negativas, tipo "insuficiente", por un "pendiente de calificación" sin connotaciones de rechazo. Pero no se trata, claro está, de proponer un simple cambio de denominación sino de plantear con claridad que la evaluación tiene como finalidad favorecer unos determinados logros y que el trabajo ha de continuar hasta conseguirlos en el tiempo que haga falta. Incluso si ello implica, en algún caso, continuar los mismos estudios el curso siguiente, es preciso presentar esta prolongación como algo positivo, como una adaptación al ritmo que el estudiante puede llevar en ese momento, con el convencimiento de que así afianzará su preparación para proseguir mejor sus estudios. Se trata, en definitiva, de introducir aquí la misma flexibilidad que se tiene con el periodo de formación de un investigador y el mismo convencimiento de que lo esencial es llegar a un producto satisfactorio, transmitiendo expectativas positivas al respecto.
Señalemos, para terminar, que una calificación con las características que acabamos de proponer se integra coherentemente en la propuesta de evaluación como instrumento de aprendizaje y su asunción genera expectativas positivas que se traducen en mejores resultados y en una nueva forma de enfocar las relaciones entre profesores y estudiantes, más de acuerdo con la propuesta de aprendizaje como investigación dirigida.
Pusimos fin, con esto, a la discusión de la evaluación del aprendizaje de las ciencias. Cabía ahora proceder a un trabajo similar en torno a la evaluación de la enseñanza y del currículo, pero el tratamiento detenido de ambas cuestiones hubiera exigido un nuevo taller de duración similar al que hemos descrito. Nos limitamos, pues, a presentar algunas actividades para una breve consideración de estos aspectos y, por último, propusimos algunas tareas para la globalización del trabajo realizado.

2.3. Evaluación de la enseñanza y del currículo

Hemos fundamentado una propuesta de evaluación como instrumento de mejora, no sólo del aprendizaje, sino de la enseñanza, del currículo, e incluso del funcionamiento del Centro y de todo el sistema educativo. Nos ocuparemos aquí brevemente de la evaluación de la enseñanza, es decir, de la actividad de los profesores, y del currículo:

A.27 ¿Qué aspectos de la actividad de los profesores y profesoras de ciencias convendría someter a evaluación? Se trata de contemplar todo aquello que pueda tener una incidencia, directa o indirecta, en la calidad de la enseñanza.

A.28. ¿Quién y cómo habría de realizar la evaluación de la actividad del profesorado?

A.29. Enumerad aspectos básicos que convenga considerar en la confección y/o evaluación de un currículo de ciencias. Dicho de otra forma, indicar aspectos debatibles que exijan toma de decisiones.

A.30. Cumplimentad el cuestionario que a continuación se presenta en torno a los distintos criterios para confeccionar o evaluar (es decir, incidir en la mejora) de un currículo de ciencias. Proceder, a continuación a la discusión de sus distintos apartados.

La función de un profesor no se limita a la impartición de su asignatura y conlleva una cierta responsabilidad en el buen funcionamiento del Centro:

A.31. Señalad aspectos del funcionamiento de un centro educativo que convenga someter a evaluación.

3. Posibles tareas de globalización del trabajo realizado en torno a la evaluación de las Ciencias

La naturaleza de los contenidos tratados en este módulo, asociados a comportamientos y actitudes que hemos asumido, muy a menudo, de forma acrítica, como algo “natural”, “de sentido común”, recomienda formas de globalización que permitan recapitular los debates que se han producido en la comunidad científica. Por ejemplo:

A.32. Escribid un diálogo entre dos profesores, uno que sostiene las concepciones sobre la evaluación que podríamos denominar “habituales” y otro las “renovadoras”.

A.33. Elaborad un cuadro comparativo de la evaluación habitual y de la propuesta alternativa que hemos construido.

A.34. Elaborad un mapa conceptual que refleje la evaluación habitual de las ciencias y otro para las propuestas renovadoras.

Referencias Bibliográficas

AGUILA, R,, FARRUS, N., GIL D y GONZÁLEZ, A., (1988). Les expectatives dels professors i els resultats de l'aprenentatge. III Jornades d'Investigació Educativa. LLeida.

ALONSO, M., (1994), La evaluación en la enseñanza de la Física como instrumento de aprendizaje. Tesis doctoral. Universitat de València.

ALONSO, M., GIL, D. y MTNEZ-TORREGROSA, J., (1992), Concepciones espontáneas de los profesores de ciencias sobre la evaluación. Obstáculos a superar y propuestas de replanteamiento, Revista de Enseñanza de la Física, 5(2), 18-38.

ALONSO, M., GIL, M. y MARTÍNEZ TORREGROSA, J., (1992)b. Los exámenes en la enseñanza por transmisión y en la enseñanza por investigación. Enseñanza de las ciencias, 10(2), 127-138.

ALONSO, M., GIL, M. y MARTÍNEZ TORREGROSA, J., (1995)a. Concepciones docentes sobre la evaluación en ciencias. Alambique, 4, 6-15.

ALONSO, M., GIL, M. y MARTÍNEZ TORREGROSA, J., (1995)b. Actividades de evaluación coherentes con una propuesta de enseñanza de la Física y la Química como investigación: actividades de autorregulación e interregulación. Revista de Enseñanza de la Física, 8(2).

ALONSO, M., GIL, D. y MTNEZ-TORREGROSA, J., (1996), Evaluar no es calificar. La evaluación y la calificación en una enseñanza constructivista de las ciencias, Investigación en la Escuela, 30, 15-26.

BAIRD, J.R. (1986). Improving learning trough enhanced metacognition: A classroom study. European Journal of Science education, 8 (3), 263-282.

BRISCOE, C., (1991), The dynamic interactions among beliefs, role methaphores and teching practices. A case study of teacher change, Science Education, 75(2), 185-199.

CALATAYUD, M.L, GIL, D y GIMENO, J.V, (1992), Cuestionando el pensamiento docente espontáneo del profesorado universitario: ¿las deficiencias de la enseñanza secundaria como origen de las dificultades de los estudiantes?, Revista Interuniversitaria de Formación del Profesorado, 14, 71-81

COLOMBO DE CUDMANI, L., PESA DE DANON, M. y SALINAS DE SANDOVAL, J, (1986). La realimentacion en la evaluación de un curso de laboratorio de Física. Enseñanza de las Ciencias, 4 (2), 122-128.

CRONIN-JONES L.L., (1991), Science teaching beliefs and their influence on curriculum implementation: two case studies, Journal of Research in Science Teaching, 38(3), 235-250.

DUSCHL, R,, (1995), Más allá del conocimiento: los desafíos epistemológicos y sociales de la enseñanza mediante cambio conceptual, Enseñanza de las Ciencias, 13(1), 3-14.

GELI, A., (1995). La evaluación de los trabajos prácticos. Alambique, 4, 25-32.

GIL, D., (1991). ¿Qué han de saber y saber hacer los profesores de ciencias?. Enseñanza de las Ciencias, 9(1), 69-77

GIL, D., (1993), Contribución de la Historia y Filosofía de las ciencias al desarrollo de un modelo de enseñanza/aprendizaje como investigación, Enseñanza de las Ciencias, 11(2), 197-212

GIL, D., (1996), New trends in Science Education, International Journal of Science Education, 18(8), 889-901.

GIL, D., (1997), Las concepciones docentes espontáneas sobre la ciencia como obstáculo para la renovación de la enseñanza de las ciencias. En Ospina E. F. (Ed), Pedagogías constructivistas, pedagogías activas y desarrollo humano (Cooperativa Editorial Magisterio: Bogotá)

GIL, D., CARRASCOSA, J. FURIO, C. y MTNEZ-TORREGROSA, J. (1991), La enseñanza de las ciencias en la educación secundaria. (Horsori: Barcelona)

GIL, D. , MTNEZ-TORREGROSA, J. y VERDÚ, R., (1999), La evaluación en una enseñanza de la Física como construcción de conocimientos, en Aspectos Didácticos de Física y Química (Física), 8, (ICE de la Universidad de Zaragoza, en prensa).

GOULD, S.J., (1982). La falsa medida del hombre (Bosch, Barcelona).

HEWSON, P.W y HEWSON, M.G, (1987), Science teachers' conceptions of teaching: implications for teachers education, International Journal of Science Education, 9(4), 425-440

HODSON, D., (1992), In search of a meaningful relationship: an exploration of some issues relating to integration in science and science education, International Journal of Science Education, 14(5), 541-566.

HOYAT, F., (1962). Les Examens. (Institut de l'UNESCO pour l'Educa-tion. Ed Bourrelier: París).

IMBERNON, F., (1990), La formación del profesorado, Cuadernos de Pedagogía, 178, 88-97.

JORBA, J. y SANMARTÍ N, (1993), La función pedagógica de la evaluación, Aula de Innovación Educativa, 20, 20-23.

JORBA, J. y SANMARTÍ, N. (1995), Autorregulación de los procesos de aprendizaje y construcción de conocimientos, Alambique, 4, 59-77

KEMPA, R.F. (1991), Students' learning difficulties in science. Causes and possible remedies. Enseñanza de las ciencias, 9(2).

LINN, M.C. (1987). Establishing a research base for science education: chalenges, trends and recommendations. Journal of Research in Science Teaching, 24 (3), 191-216.

PORLÁN, R. (1993), Constructivismo y Escuela. Hacia un modelo de enseñanza-aprendizaje basado en la investigación. (DIADA: Sevilla).

POZO, I., GÓMEZ, M.A., LIMÓN, M. y SANZ, A., (1992). Procesos cognitivos de la ciencia: Las ideas de los adolescentes sobre la Química. (CIDE, MEC, Colección Investigadora).

RODRÍGUEZ, L.M., GUTIÉRREZ, F.A. y MOLLEDO, J., (1992). Una propuesta integral de evaluación en Ciencias. Enseñanza de las Ciencias, 10(3), 254-267.

ROSENTHAL, R. y JACOBSON, L., (1968). Pigmalion in the classroom. (Rineheart and Winston: New Jersey).

SANTOS, M.A, (1993), La evaluación: un proceso de diálogo, comprensión y mejora, Investigación en la Escuela, 20, 23-35.

SATTERLY, D. y SWAM, N. (1988). Enseñanza de las Ciencias, 6 (3), 278-284.

SPEARS, M.G. (1984). Sex bias in science teachers' ratings of work and pupils characteristics. European Journal of Science Education, vol 6, 369-377.

TAMIR, P. (1998), Assessment and evaluation in science education: opportunities to learn and outcomes. En Fraser B.J. y Tobin K.G (Eds) International Handbook of Science Education. (Kluber Academic Publishers: London).

VIENNOT, L. (1989). L'enseignement des sciences phusiques object de recherche. Bulletin de l'Union des Physiciens, 716, 899-910.

Pulse para continuar

Regresar a índice
Programación OEI Página Principal de la OEI Más información: weboei@oei.es