Leer Ensayo Completo Modelos De Evaluacion Educativa

Modelos De Evaluacion Educativa

Imprimir Documento!
Suscríbase a ClubEnsayos - busque más de 2.004.000+ documentos

Categoría: Ciencia

Enviado por: Ledesma 31 marzo 2011

Palabras: 21320 | Páginas: 86

...

laramente la evaluación de otras materias. Una definición importante, y que se viene dando desde hace mucho tiempo, afirma que la evaluación supone comparar objetivos y resultados, mientras que otras exigen una conceptualización más amplia, apelando a un estudio combinado del trabajo en sí y de los valores. Muchas de las distintas definiciones formu¬ladas aparecen en los diferentes modelos de evaluación presentados.

Esta definición es consecuente con lo que dice comúnmente el diccionario y, de una manera más específica, es la que ha adoptado el Joint Committee on Standards for Educational Evaluation. La definición es la siguiente: la evalua¬ción es el enjuiciamiento sistemático de la valía o el mérito de un objeto.

Esta definición se centra en el término valor e implica que la evaluación siempre supone juicio. Desde el momento en que la evaluación, en un sentido óptimo, emplea procedimientos objetivos para obtener una información segura e imparcial, ya está ligada a la valoración. En efecto, su meta esencial es determinar el valor de algo que esta siendo enjuiciado. De acuerdo con esta definición, si un estudio no informa de cuán buena o mala es una cosa, no se trata V de una evaluación.

Algunos autores se han mostrado contrarios a esta posición. Green que esta orientación valorativa conduce a interpretaciones radicales y subjetivas que conceden un poder inmerecido a los evaluadores e impiden el progreso. Afirman, por así decirlo, que la belleza reside en los ojos del observador (y que las valoraciones de un grupo no deben tener precedencia sobre las de otro a la hora de determinar si alga es bueno o malo. También afirman que la evaluación es, demasiado a menudo, una fuerza negativa y, en general, mala psicología. Pero sus argumentos solo nos convencen de que la mayoría de las evaluaciones no son determinantes y de que es difícil hacerlas bien; quizás existen muchas evaluaciones distintas, y posiblemente contradictorias en apa¬riencia, de un objeto dado, dependiendo de la posición valorativa que se adop¬ta. Pero, inevitablemente, la valoración debe desempeñar un papel. Y si sirve al progreso y se utiliza para identificar los puntos débiles y los fuertes, y para (tender hacia una mejora, puede ser una fuerza positiva. Como puede verse la evaluación es una empresa compleja.

Creemos que este aspecto de la complejidad no debe ser interpretado en el sentido de que estas evaluaciones solo deben ser consideradas como procesos mentales que se producen de un modo natural, conduciéndonos así hacia una gran variedad de interpretaciones sabre el valor de algo.

A me¬nudo, existen distintos públicos, que exigen o necesitan cosas distintas de un servicio profesional. Por ejemplo, a las familias acaudaladas quizá les importe más el hecho de que las escuelas publicas preparen a los estudiantes para en¬trar en colegios de elite y en universidades, mientras que los nuevos inmi¬grantes, que son pobres y hablan muy poco ingles, quizá rechacen las escuelas que no ofrecen una educación bilingüe, no atienden a los hijos atrasados y no promueven la integración social. A la hora de evaluar un distrito escolar en concreto, un evaluador competente debe tener en cuenta, nuestra definición, entre otras cosas, estas dos perspectivas de valoración. De hecho, podríamos afirmar que las necesidades que unen o separan a los clientes de un determinado servicio son las que deben considerarse como base para decidir que tipo de información se debe recopilar y a qué criterios recurrir para determinar la valía o el mérito de un servicio.

Los términos valía y mérito también deben ser definidos para enriquecer nuestro concepto de evaluación. SCRIVEN (1981) ya ha indicado las trascen¬dentales diferencias que hay entre ellos y el importante papel que desempeñan a la hora de determinar el valor de alga. Por ejemplo, un programa para formar a profesores de Historia, podrá producir profesores que enseñen His¬toria a otros de un modo efectivo y de manera que se pueda confiar en ellos. Si lo hace, será meritorio, pero puede que no sea válido. Par ejemplo, si la sociedad ya no necesita más profesores de Historia porque ya tiene más de los que puede emplear, entonces aunque el programa sea muy bueno —y quizá sea mejor que otros parecidos—, continuar con el mismo nivel de expansión del pro¬grama quizá no sea la mejor manera de gastar sus escasos recursos. Aunque un programa meritorio puede no ser válido, debemos indicar que un progra¬ma que no sea meritorio no puede ser válido. Puede que no sea bueno formar malos profesores de Historia aunque exista una gran escasez de ellos.

La Última base valorativa que vamos a mencionar aquí es la equidad. Es importante indicar que nuestro concepto de equidad es complejo. No es suficiente decir que los servicios públicos educativos deben poder ser requeridos y usados por todo el mundo. Como ha dicho KELLAGHAN (1982), para que exista verdaderamente la igual¬dad deben existir siete indicios de equidad:

1. Los servicios públicos educativos de una sociedad deben estar pensados para toda la población.

2. Todos los sectores de la sociedad deben tener el mismo tipo de acceso a los servicios.

3. Todos los grupos deben disfrutar de una participación equitativa en la utilización de los servicios.

4. Los niveles de logro, por ejemplo, los años en el sistema educativo, no serán significativamente distintos para los diferentes grupos.

5. Los conocimientos exigidos para alcanzar los objetivos del servicio no de¬ben ser sustancialmente diferentes para los distintos grupos.

6. Las aspiraciones vitales que se persiguen deben ser similares en todos los grupos sociales.

7. El sistema del servicio deberá producir resultados similares en lo que se refiere a la mejora en el bienestar de todos los grupos sociales.

De la discusión anterior, se puede colegir que la definición de evaluación que hemos propuesto es engañosa en su aparente simplicidad. Cuando exami¬nemos seriamente el término base valor, debemos inevitablemente tomar en consideración tanto las perspectivas de valoración como la información, la combinación de ambas con el fin de conseguir averiguar el valor de algo y, por último, la transformación de los resultados en conocimientos operativos que se utilizarán para suministrar o no suministrar (o para comprar o no comprar) ciertos servicios y para mejorar los que ya se están ofreciendo.

Antes de terminar con este tema de la definición de evaluación, debemos considerar otros tres aspectos de la evaluación. El primero se refiere a si la evaluación necesita ser comparativa; el segundo, a las principales utilizaciones de la evaluación; y el tercero se pregunta hasta qué punto los evaluadores necesitan cualificaciones especiales.

Algunos autores (Stake, Scriven, Cronbach) han indicado que la eva¬luación puede centrarse en un solo producto o servicio, o compararlo con otras alternativas válidas. Por otra parte, han debatido los méritos de estas dos posturas, para acabar quedándose con una de ellas. Nosotros creemos que, dependiendo de las circunstancias, una evaluación puede ser, legítimamente, tanto comparativa como no comparativa.

Algo que se debe tener muy en consideración es la naturaleza de la audien¬cia y qué es lo que necesita saber acerca del objeto de la evaluación. Si la audiencia está compuesta por consumidores que desean escoger un producto o servicio, la evaluación debe ser comparativa y ayudar a los consumidores a saber qué alternativas son convenientes y cómo compararlas críticamente. Si por el contrario, la audiencia incluye promotores o consumidores que ya están comprometidos con el desarrollo o el uso de un programa determinado, es mejor que la evaluación se centre intensamente en la evolución del programa para intentar mejorarlo. A veces sucede, sin embargo, incluso si un grupo es totalmente devoto e cierto servicio o producto, que, al considerar otras opcio¬nes, obtiene mejores resultados de su proveedor o encuentra una alternativa mejor.

En general, creemos que la evaluación debe ser comparativa antes de que empiece el proceso o antes de suscribirse a un servicio, no comparativa duran¬te el proceso (para que permita concentrarse en lo que resulte mejor para el desarrollo del servicio), y periódicamente comparativa después del proceso y/o la utilización continuada, para que el camino quede abierto ante posibles ma¬yores avances.

Hablando en general, que una evaluación deba ser comparativa o no de¬pende de lo que se quiera conseguir de esa evaluación, en cuanto a su utili¬zación se refiere. Nosotros consideramos tres fines principales: perfec¬cionamiento, recapitulación y ejemplificación. Hay que prestar mucha atención a la naturaleza y las necesi¬dades de los consumidores, y a la relación existente entre el proceso y los resultados. En este punto, los evaluadores deberían estar muy en contacto con el personal del programa y servir como guías para las tomas de decisio¬nes. El plan de evaluación necesita ser flexible y receptivo.

La recapitulación se trata de análisis retrospectivos acerca de pro¬yectos ya terminados, programas ya hechos o productos ya acabados. La información no va dirigida al personal encargado de su desarrollo, sino a los patro¬cinadores y consumidores. Debe incluir una valoración de la eficacia de lo invertido, siendo también importantes las comparaciones con los más importantes competidores. La información que se deriva de estos profundos estudios comparativos es muy interesante para la audiencia en este tipo de situaciones.

La tercera utilización es la ejemplificación. Básicamente, la evaluación y la investigación son actividades distintas. La primera se dedica a considerar todos los criterios que se utilizan en la determinación de un valor, mientras que la segunda se limita más bien al estudio de ciertas variables que tienen un interés teórico. Las evaluaciones suelen utilizar métodos subjetivos y no están tan estrechamente controladas ni sujetas a manipulación como las investigacio¬nes. No obstante, los resultados obtenidos, en un cierto período de tiempo, evaluando servicios pueden facilitar información que luego será utilizada para crear y ensayar una teoría. Y, sin duda, los resultados de las evaluaciones a menudo debería conducir v conducen, de hecho, a unas conclusiones más concretas e interesantes en el terreno de la investigación. Por lo tanto, cree¬mos que es importante que los evaluadores, al planificar sus estudios, tengan en cuenta que sus conclusiones pueden ser utilizadas en el contexto de una investigación que se proponga una comprensión más amplia de los fenóme¬nos examinados en la evaluación. Con una planificación más minuciosa y cui¬dadosa, las evaluaciones pueden servir no solo como guía de programas opera¬tivos, o como resumen de sus contribuciones, sino también para ilustrar inves¬tigaciones concretas o cuestiones teóricas.

Así pues, parece claro que la evaluación es un concepto altamente complicado. A la hora de planificar o dirigir una evaluación, deben tenerse en cuenta una serie de cuestiones: ¿Que valores deben ser mencionados al juzgar los resultados? ¿Qué criterios deben ser adoptados y cuales deben tener preferencia? ¿La evaluación debe ser comparativa? ¿La evaluación debe estar capacitada para guiar el desarrollo, responsa¬bilizar a los profesionales, ordenar las opciones o promover nuevas intui¬ciones acerca de los fenómenos implicados? Si se tienen en cuenta estas cuestiones con el fin de que la audiencia confíe en los resultados y los utilice, los evaluadores deben mantener ciertos criterios o normas en su trabajo. Como consecuencia, creemos que la distinción entre evaluaciones profesionales y evaluaciones informales es importante. Desde lue¬go, todo el mundo recurre a las segundas cuando se trata de emplear, opinar, aceptar o comprar cosas. Pero ocurre demasiado a menudo que nuestras eva¬luaciones resultan poco o nada sistemáticas y en modo alguno convincente, ni siquiera para nosotros mismos. En muchos casos, preferiríamos que nues¬tras conclusiones tuvieran más relevancia, rigor v objetividad. Estos requi¬sitos, sin embargo, requerirían a menudo más tiempo, dinero y habilidad de los que nosotros tenemos.

Así, en muchas ocasiones, las buenas evaluaciones deben ser realizadas por un personal especializado. Aunque nuestra definición afirma que la evaluación es sistemática, muchas veces, sin duda, no lo es. Lo que intentamos proponer en este libro es una especie de evaluación que sea justificable. La clase de evaluación que tenemos en mente requiere un esfuerzo sistemático por parte de una o más personas que posean, en principio, un cierto nivel mínimo en lo que se refiere a las técnicas evaluativas que se exigen en estos casos. Pensamos que el concienzudo estudio que propone este libro puede ayudar al estudiante a alcanzar el nivel básico de habilidad que se necesita para llevar a buen término nuestro concepto de evaluación sistemática v para evaluar las evaluaciones realizadas por otros.

Las Normas del Joint Committee pueden aplicarse en cualquier etapa del proceso evaluativo: deben ser tenidas en cuenta, por ejemplo, a la hora de decidir si hay que realizar la evaluación o no, a la hora de planear la evaluación y llevarla a cabo, al presentar los resultados y al aplicar las conclusiones. Por lo tanto, la utilización de las Normas no solo sirve pare controlar la calidad de un informe ya terminado, sino también como asesoramiento duran¬te la realización de la evaluación. Un segundo punto que hay que tener en cuenta es que las distintas normas son más o menos importantes en cada etapa de la evaluación. Así, quienes utilicen las normas deben estudiarlas y analizarlas comparativamente con el fin de poder aplicarlas juiciosamente en cada una de las etapas de la evaluaci6n.

Las normas mas relevantes incluyen:

Normas de utilidad: Las normas de utilidad tienen el propósito de asegurar que una evaluación va a satisfacer las necesidades de información manifestadas por los usuarios. Estas normas son las siguientes:

Identificación de la audiencia: Debería identificarse a las personas implicadas o afectadas por la evaluación para que sus necesidades puedan satisfacerse.

Credibilidad del evaluador: Las personas que llevan a cabo la evaluación deberían ser creíbles y competentes para desarrollarla, de modo que los resultados de la evaluación resulten lo más creíbles y aceptables que sea posible.

Selección y alcance de la información: La información recogida debería ser seleccionada con la amplitud suficiente para que pueda enfocarse hacia las preguntas pertinentes sobre el programa y responder a las necesidades e intereses de los clientes y demás audiencias identificadas.

Identificación de valores: Habría que describir cuidadosamente las perspectivas, los procedimientos y la racionalidad utilizada para interpretar los resultados, de modo que estén claras las bases sobre las que se establecen los juicios de valor.

Claridad del informe: Los informes de evaluación debería describir con claridad el programa que está siendo evaluado, incluyendo su contexto, los propósitos, procedimientos y resultados de la evaluación, para que pueda disponerse de información esencial y fácilmente comprensible.

Difusión y periodicidad del informe: Los resultados parciales significativos y los informes de evaluación se deberían difundir a los usuarios interesados, de suerte que pueden utilizarlos cuando sea necesario.

Consecuencias de la evaluación: Las evaluaciones deberían planificarse, llevarse a cabo y difundirse siguiendo los continuos requerimientos de las audiencias, de esto modo aumentaría la probabilidad de que las evaluaciones resultasen útiles.

Normas de factibilidad: Tienen el propósito de asegurar que una evaluación es realista, prudente, diplomática y frugal. Las normas son las siguientes:

Procedimientos prácticos: Los procedimientos de evaluación debería ser prácticos, de forma que mientras la información se recoge haya un mínimo de interferencia en el desarrollo del programa.

Viabilidad política: La evaluación debería planificarse y realizarse teniendo en cuenta las diferentes posiciones mantenidas por los distintos grupos de intereses, de esto modo se aseguraría su cooperación, y sería posible anticipar, contrarrestar o evitar los posibles intentos que se realicen para restringir, sesgar o aplicar equivocadamente los resultados.

Relación coste-beneficio: La evaluación debería ser eficiente y producir información valiosa para justificar los recursos empleados.

Normas de legitimidad: Las normas de legitimidad tienen el propósito de asegurar que una evaluación se llevará a cabo legal y éticamente, y en beneficio de quienes están implicados en la evaluación, así como de aquéllos que están afectados por sus resultados.

Orientación del servicio: Las evaluaciones deberían diseñarse para ayudar a las organizaciones a dirigirse y prestar un servicio efectivo en función de las necesidades de los participantes a los que están destinadas.

Acuerdos formales: Las obligaciones de las partes formales respecto de la evaluación (lo que debe hacerse, cómo, por quién, cuando) deberían acordarse por escrito, para que esas partes estén obligadas a cumplir todas las condiciones del acuerdo o a renegociarlas formalmente.

Derechos de las personas: Las evaluaciones deberían diseñarse y llevarse a cabo respetando y protegiendo los derechos y el bienestar de las personas.

Interacciones humanas: Los evaluadores deberían respetar la valía y la dignidad humana en sus interacciones con otras personas vinculadas con la evaluación, de modo que los participantes no se vean amenazados o perjudicados.

Apreciación completa y justa: La evaluación debería ser completa y justa en su examen y registro de las debilidades y fortalezas del programa evaluado, de modo que pueda avanzarse a partir los puntos fuertes del programa e identificarse las áreas problemáticas.

Revelación de los resultados: Las partes formales de una evaluación deberían asegurar que todos los resultados de la evaluación, junto con las limitaciones pertinentes, resulten accesibles a las personas afectadas por la evaluación y cualesquiera otras con derechos legales reconocidos para recibir los resultados.

Conflicto de intereses: Los conflictos de intereses deberían enfrentarse con apertura y honestidad, de modo que no comprometiesen al proceso y los resultados de la evaluación.

Responsabilidad fiscal: La asignación del evaluador y el empleo de los recursos deberían reflejarse convenientemente a través de procedimientos de control de cuentas y, por otra parte, deberían ser prudentes y éticamente responsables, de modo que los gastos se justifiquen y resulten apropiados.

Normas de precisión: Las normas de precisión se han promovido para asegurar que una evaluación presente y proporcione información técnicamente adecuada sobre los rasgos que determinan el valor o mérito del programa evaluado. Estas normas son las siguientes:

Documentación del programa: El programa que está siendo evaluado debería describirse y documentarse de forma clara y precisa, para que pueda ser identificado con claridad.

Análisis del contexto: Debería examinarse con todo detalle el contexto en que se desarrolla el programa, de modo que puedan identificarse las posibles influencias sobre el programa.

Propósitos y procedimientos observados: Los propósitos y los procedimientos de evaluación deberían describirse y controlarse con bastante detalle, de forma que puedan identificarse y valorarse.

Fuentes de información válidas: Las fuentes de información utilizadas en la evaluación de un programa deberían describirse con todo detalle, para que pueda apreciarse la validez de dicha información.

Información válida: Los procedimientos de recogida de la información deberían elegirse o elaborarse y, más tarde, aplicarse de modo que pudiesen asegurar que la interpretación consiguiente resultase válida para el uso pretendido.

Información fiable: Los procedimientos de recogida de la información deberían elegirse o elaborarse y, más tarde, aplicarse de modo que pudiesen asegurar que la información obtenida resultase fiable para el uso pretendido.

Información sistemática: La información recogida, analizada y difundida en una evaluación debería ser revisada sistemáticamente y corregidos cualesquiera posibles errores detectados.

Análisis de la información cuantitativa: La información cuantitativa debería analizarse de forma sistemática y apropiada para que se pudiera responder de forma efectiva a las cuestiones de evaluación.

Análisis de la información cualitativa: La información cualitativa debería analizarse de forma sistemática y apropiada para que se pudiera responder de forma efectiva a las cuestiones de evaluación.

Fundamentación de las conclusiones: Las conclusiones alcanzadas en una evaluación deberían ser justificadas de forma explícita, para que las audiencias puedan valorarlas.

Información imparcial: Los procedimientos para informar deberían salvaguardar contra la distorsión originada por sesgos de cualquier parte y por los sentimientos personales, de modo que los informes de evaluación reflejen adecuadamente los resultados de la evaluación.

Metaevaluación: La evaluación en sí misma debería ser evaluada formativa y sumativamente con estas y otras normas que se consideren pertinentes, de modo que su realización pueda orientarse de un modo apropiado y, en cuanto se termine, las audiencias puedan examinar rigurosamente sus debilidades y fortalezas.

Un simple recuento de las normas revisadas nos muestra que el cuarenta por ciento de ellas, 12 sobre 30, son normas de precisión. Una primera interpretación de este dato nos lleva a considerar seriamente el peso histórico desempeñado por las anteriores ediciones de normas centradas en la medición educativa. Muchos de los miembros del Comité que elaboraron las normas para la evaluación de programas también forman parte de los comités que elaboran normas para tests y pruebas de rendimiento. Un análisis más detenido de las normas sobre evaluación de programas, proyectos y materiales revela que éstas, siendo un instrumento de consulta obligada y de orientación para cualquier evaluador educativo, han omitido algunos temas de interés para evaluadores y audiencias. Es el caso de las normas relativas a los referentes con los que se suelen comparar los programas durante el proceso de evaluación, a los criterios de evaluación que se utilizan, o a los indicadores que suelen emplearse para determinar el mérito o valor de un programa. Algunas de posibles respuestas a estos temas se encuentran precisadas en los modelos de evaluación que revisaremos más adelante.

CONCLUSIONES Y REFLEXIONES

El concepto que expresan Stufflebeam y Patton (1985), es compartido plenamente en este trabajo. La evaluación se define como la emisión de juicios de valor y mérito a partir de un proceso de descripción, análisis e interpretación de información relevante que se obtenga.

En relación al concepto de evaluación, conviene aclarar que, contrariamente al mal entendido de algunos, la evaluación como emisión de juicios de valor y de mérito, no implica someter a juicio sumario a la universidad pública; tampoco las comisiones institucionales de evaluación deben considerarse tribunales, ni los representantes de los gobiernos o de sectores sociales, a expensas de evaluaciones externas, deben erigirse motu propio en fiscales de oficio, como en algunas ocasiones ha ocurrido.

Por otra parte, a emitir juicios de valor y mérito no se trata de realizar juicios de hecho. Los primeros nos ayudan a comprender un fenómeno bajo un proceso subjetivo-objetivo, los segundos nos permiten hacer ciencia.

En definitiva, los juicios de valor sobre una institución de educación superior nos llevan a decir lo bueno y lo malo; sus fortalezas y sus debilidades tomando como punto de partida un ideario o plan de trabajo establecidos. De lo bueno que se observe, es menester emitir juicios de mérito, esto es, determinar dos cosas importantes: Una, la relevancia política o utilidad práctica de las acciones universitarias. Dos, apreciar su excelencia o aquello que responde a sistemas de reputación académica.

• Etapas de desarrollo de la evaluación como área de estudio profesional.

Ninguna introducción a la evaluación entendida como una práctica profe¬sional estará completa si no se presta la debida atención a la evolución histórica del tema. Cualquier profesión, pare poder satisfacer las necesidades de sus clientes, debe evolucionar de acuerdo con los cambios de las necesidades sociales y teniendo en cuenta todos los avances teóricos v técnicos. A menos que los miembros de una profesión elaboren y sostengan una perspectiva histórica sobre su trabajo, probablemente seguirán teniendo siempre una concepción limitada de su función social, sin poder estimular la innovación ni histórico con el fin de informar al lector sobre los acontecimientos mes significativos ocurridos en el campo de la evaluación.

Nuestro análisis histórico se basa en un trabajo clave de Ralph W. Tyler que a menudo es considerado el padre de la evaluación edu¬cativa. Utilizando sus contribuciones iniciales como principal punto de refe¬rencia, hemos establecido cinco periodos básicos: 1) el periodo pre-Tyler, que abarca hasta 1930; 2) la época tyleriana, que va desde 1930 hasta 1945; 3) la época de la «inocencia», desde 1946 hasta 1957; 4) la época del realismo, que cubre el periodo 1958-1972; y 5) la época del profesionalismo, que in¬cluye la evolución experimentada desde 1973 hasta el presente.

El periodo pre-tyleriano

La evaluación sistemática no era desconocida antes de 1930, pero tampoco era un movimiento reconocible. El hecho de evaluar individuos y programas apareció, como mínimo, en el año 2000 A.c.,cuando algunos oficiales chinos dirigieron unas investigaci7e-s—de los servicios civiles, y en el siglo v A.c., cuando Sócrates v otros maestros griegos utilizaron cuestionar; como parte de su metodología didáctica. En el siglo XIX en Inglaterra, se utilizaron comisiones reales para evaluar los servicios públicos. En 1845, en los Estados Unidos, Horace Mann dirigió una evaluación, basada en tests de rendimiento, pare saber si las escuelas de Boston educaban bien a sus estu¬diantes. Entre 1887 v 1898 Rice estudió los conocimientos en ortografía de 33 000 estudiantes de un amplio sector escolar y sacó la conclusión de que la gran insistencia en la enseñanza de la ortografía, que entonces estaba en boga, no había producido avances sustanciales en el aprendizaje. Este es¬tudio este generalmente reconocido como la primera evaluación formal sobre un programa educativo realizado en America. Desde entonces, el proceso de acreditación se ha convertido en uno de los principales medios para evaluar los servicios educativos. Una aproximación mayor a la eva¬luación se produjo, en los primeros altos de este siglo, con la aparición de los tests estandarizados. Este acontecimiento formaba parte de un gran esfuer¬zo que pretendía que la educación fuera más eficiente para que un mayor número de estudiantes pudiera utilizar los recursos entonces disponibles en las escuelas.

El breve resumen anterior viene a confirmar que la evaluación sistemática tiene una larga historia. Mientras que sólo muy recientemente se ha llegado a considerar la evaluación coma una practica profesional, buena parte del trabajo evaluativo moderno continúa basándose en ideas y técnicas que ya se aplicaban hace mucho tiempo, como por ejemplo las encuestas, las comisio¬nes, la acreditación y las comparaciones experimentales de varios programas.

La época tyleriana

En los primeros años de la década de los treinta, Ralph Tyler acuñó el término evaluación educacional y publicó una amplia y renovadora visión de currículo y evaluación. En un período de alrededor de quince años, desarrolló sus intuiciones hasta que conformaron un método que suponía una clara alternativa a otras perspectivas.

La principal característica de su método era que se centraba en unos obje¬tivos claramente fijados. De hecho, definía la evaluación como algo que deter¬mina si han sido alcanzados ciertos objetivos. Como consecuencia de esta de¬finición, los evaluadores debían ayudar a quienes elaboraban currículos a cla¬rificar el rendimiento de los estudiantes, que había sido precisamente deter¬minado a través de la realización de un currículo. Los objetivos resultan¬tes, referidos al rendimiento, proporcionaban entonces la base para elaborar un currículo y un test de desarrollo. La elaboración del currículo queda¬ba así influida tanto por los contenidos que debían aprenderse como por la evolución del rendimiento de los estudiantes. La tecnología de los tests de desarrollo iba a servir de base para la elaboración de tests relacionados con los objetivos, y también a los relacionados con las diferencias individuales y con las normas nacionales o del estado.

Durante la década de los treinta, los Estados Unidos, como el resto del mundo, cayó en las profundidades de la Gran Depresión. Las escuelas, como otras instituciones públicas, se estancaron en una ausencia total de recursos y optimismo. Justo cuando Roosevelt intentaba con su New Deal sacar de este abismo a la economía americana, John Dewey y algunos otros intentaron con¬tribuir a que la educación se convirtiera en un sistema dinámico e innovador, que a la vez se fuera renovando a sí mismo. Con el nombre de Educación Progresiva, este movimiento reflejó la filosofía del pragmatismo y empleó los instrumentos de la psicología conductista.

Tyler se vio metido de lleno en este movimiento cuando le encargaron di¬rigir la parte de investigación del hoy famoso Eight-Year Study (SMITH y TYLER, 1942). Este estudio fue pensado para examinar la efectividad de cier¬tos currículos renovadores y estrategias didácticas que se estaban empleando en treinta escuelas a lo largo de toda América. El estudio resulta notable porque ayudó a Tyler a difundir, ensayar y demostrar su concepción de la evaluación educacional de una manera inmediata.

A través de este programa de ámbito nacional, Tyler pudo publicar lo que él veía como un método que tenía claras ventajas sobre los demás. Desde el 1 momento en que la evaluación tyleriana incluía comparaciones internas entre los resultados y los objetivos, va no necesitaba recurrir a costosas y problemá¬ticas comparaciones entre grupos de control y grupos experimentales. El mé¬todo se centra en determinar el grado de éxito, por lo que se opone a métodos indirectos que determinan factores como la calidad de la enseñanza, el número de libros que has' en la biblioteca, los materiales y la participación de la comu¬nidad. Y además, las evaluaciones tylerianas no se ven demasiado afectadas por la fiabilidad de las diferencias entre las puntuaciones individuales de los alumnos ya que generalmente cubren una franja más amplia de variables exógenas que las cubiertas por los tests tipificados. Todos estos argumentos fueron bien recibidos por el sector de la educación americana, y a mediados de los años 40 Ralph Tyler ya había conseguido la categoría suficiente como para ejercer una gran influencia sobre el panorama educacional en los próximos veinticinco años

La época de la inocencia

Para la sociedad americana, los últimos años 40 y la década de los 50 fue un tiempo para olvidar la guerra, dejar atrás la Depresión, crear y desa¬rrollar aptitudes, adquirir recursos, y lograr disfrutar de la «buena vida». Pudríamos haber calificado esta época como el período de expansión, pero hay que tener en cuenta que también existía una amplia complacencia a la hora de enjuiciar los graves problemas de aquella sociedad. Como consecuencia, creemos que es mejor referirnos a esta época como al Período de «inocencia» e incluso de la irresponsabilidad social.

Este período fue un tiempo de po¬breza y desesperación en las ciudades del interior y en las áreas rurales, pero al parecer casi nadie, excepto los afectados, se dio cuenta. Fue un período de profundos prejuicios raciales y de segregación, pero gran parte de la población blanca parecía inconsciente de esta enfermedad. Fue un período de exorbit¬ado consumo y de gran despilfarro de los recursos naturales, sin tener en cuenta que un día estos recursos iban a agotarse. Fue un período de un abru¬mador desarrollo de la industria y la capacidad militar, pero se tomaron muy pocas precauciones contra los perjuicios que iban a sufrir el paisaje y las fu- taras generaciones.

Más que de la evaluación educacional, se trató de una expansión de las áreas educacionales, del personal y de las facilidades. Se construyeron nuevos edificios. Aparecieron nuevos tipos de instituciones educativas, como los colegios comunitarios. Los pequeños distritos escolares se unieron a otros con el fin de proporcionar un más amplio abanico de servicios educativos, coma ya lo hacían los sistemas escolares más grandes, incluyendo servicios para la salud mental y física, consejos escolares, comedores, enseñanzas musicales, amplios programas deportivos, educación comercial y técnica y educación social. Se incrementaron desmesuradamente las inscripciones en los programas educati¬vos para maestros y, en general, las inscripciones en los colegios aumentaron espectacularmente.

Este panorama general de la sociedad y la educación se reflejó también en la evaluación educacional. Mientras se producía esta gran expansión de la educación, la sociedad no parecía tener un gran interés en formar profesores com¬petentes, en localizar y solucionar las necesidades de los menos privilegiados o en identificar y solucionar los problemas del sistema educativo.

Como consecuencia, los educadores dispusieron de nue¬vos servicios de tests y de nuevas maneras de calificarlos, de algoritmos para designar objetivos de comportamiento, de taxonomías de objetivos, de nuevos modelos experimentales y de nuevos procedimientos estadísticos para analizar los datos educativos. Pero estas contribuciones no se derivaban de un análisis de la información necesaria para valorar y perfeccionar la educación, ni repre¬sentaban on desarrollo de la experiencia escolar.

Durante este periodo, las evaluaciones educacionales dependían, coma ya lo habían hecho antes, sabre todo, de los limites de los distritos escolares locales. Las escuelas, pues, dependían del interés y la habilidad locales para poder hacer o no una evaluación. Las agencias federales y estatales no estaban demasiado introducidas en el campo de la evaluación de programas. Los fondos destinados a las evaluaciones provenían de las arcas locales, de fundaciones o de organizaciones profesionales. Esta ausencia de ayudas exteriores y de apoyos para la realización de evaluaciones en todos los niveles de la educación iba a concluir con la llegada del próximo periodo de la historia de la evaluación.

La época del realismo

La epoca de la inocencia en la evaluación tuvo on brusco final con el auge, a finales de los años 50 y principios de los 60, de las evaluaciones de proyectos de currículos a gran escala, financiadas par estamentos federales. Los educa¬dores se encontraron, durante este periodo, can que ya no podían hacer o no hacer las evaluaciones a su antojo, y que los futuros progresos de las metodologías evaluativas deberían estar relacionados con conceptos coma utilidad y relevancia. Su violento despertar, en este periodo, marcaría el final de una era de complacencia y ayudó a emprender profundos cambios, guiados para el in¬terés público y dependiendo del dinero de los contribuyentes para so financia¬ción, lo cual condujo a que la evaluación se convirtiera en una industria y en una profesión.

Como consecuencia del lanzamiento, par parte de la Unión Soviética, del Spútnik en 1957, el gobierno federal respondi6 promulgando la National Education Act de 1958. Entre otras cosas, esta acta proporciono nue¬vos programas educativos en matemáticas, ciencias e idiomas, y creo servicios asesores y programas de encuestas en los distritos escolares. Aparecieron, así, un cierto número de nuevos proyectos nacionales para el desarrollo de currícula, especialmente en las áreas de ciencias y matemáticas. Finalmente, se asig¬naron fondos para evaluar estos programas.

Los cuatro métodos evaluativos expuestos hasta hache estaban ya represen¬tados en las evaluaciones que se realizaron en este periodo. Primero, el método Tyler fue usado para definir los objetivos de los nuevos currículos y para valorar el grado en que estos objetivos quedaban, más tarde, alcanzados. Segundo, los nuevos tests estandarizados a nivel nacional sirvieron para refle¬jar mejor los objetivos y los contenidos de los nuevos currículos. Tercero, el método del criterio profesional fue usado .para valorar las propuestas y veri¬ficar periódicamente los resultados. Finalmente, muchos evaluadores se comprometieron a evaluar los resultados del desarrollo del currícula a través de prue¬bas concretas.

A principios de los años 60, algunos de los más importantes evaluadores educacionales se dieron cuenta de que so trabajo y sus conclusiones no ayuda¬ban demasiado a los que elaboraban currículos, y no respondían a las pregun¬tas sobre los programas que planteaban aquellos que necesitaban comprobar so grado de efectividad. La «flor y nata» de la comunidad evaluativa educacio¬nal particip6 en estos esfuerzos para evaluar los nuevos currículos; estaban adecuadamente financiados y aplicaban cuidadosamente la tecnología que había ido desarrollándose durante la pasada década o incluso antes. A pesar de todo esto, empezaron a darse cuenta de que sus esfuerzos no tenían éxito.

Cronbach argüía que el análisis y la relación de los resultados de un test podrían ser, probablemente, de más utilidad para los profesores que informarles sobre el promedio del total de las calificaciones. Cuando fue publicado por primera vez, el consejo de Cronbach y sus recomendaciones pasaron inadvertidos durante mucho tiempo, exceptuando un pequeño círculo de especialistas en evaluaciones. De cualquier manera, el artículo era básico y contenía hipótesis sobre la concep¬tualización y la dirección de evaluaciones que iban a considerarse totalmente válidas al cabo de muy pocos años.

En 1965, conducida por la clarividencia del senador Hubert Humphrey, el carismático liderazgo del presidente John Kennedy y la gran habilidad política del presidente Lyndon Johnson, se desencadenó la Guerra contra la Pobreza. Estos programas invirtieron billones de dólares en reformas que pretendían igualar y aumentar las oportunidades para todos los ciudadanos de los Estados Unidos a través de una amplia serie de servicios sanitarios, sociales y educa¬tivos. La expansión de la economía permitió que el gobierno federal finan¬ciara estos programas, y se consiguió un gran apoyo de toda la nación para desarrollar lo que el presidente Johnson llamó la Gran Sociedad.

Junto a este esfuerzo masivo para ayudar a los necesitados, se produjo, en ciertas regiones, una cierta preocupación por el posible despilfarro de las inversiones si no se exigían algunos requisitos en la contabilidad. En respuesta a estas preocupaciones, el senador Robert Kennedy y algunos de sus colegas del congreso promulgaron el Acta de la Educación Elemental y Secundaria de 1965 que incluía requisitos específicos para la evaluación. Como resultado, el primer artículo de esa acta (que aspiraba a proporcionar una educación com¬pensatoria a los niños menos favorecidos) exigía específicamente que cada dis¬trito escolar recibiera fondos, basándose en ese artículo, para que evaluara anualmente hasta qué punto los proyectos que había realizado al amparo del artículo 1 habían alcanzado sus objetivos, todo ello utilizando los datos de tests debidamente estandarizados. Este requisito, con su referencia específica a las encuestas y a la valoración de la congruencia entre resultados y objetivos, refleja cómo se encontraba la evaluación educacional en aquella época. Y, lo que es más importante, el requisito obligó a los educadores a que trasladaran sus preocupaciones, en lo que se refiere a la evaluación educacional, desde el campo de la teoría y las suposiciones al de la práctica y el perfecciona¬miento.

Cuando los distritos escolares empezaron a responder a los requisitos eva¬luativos del artículo 1, comprobaron rápidamente que los instrumentos y estra¬tegias que empleaban entonces los evaluadores, resultaban totalmente inapro¬piados para aquel trabajo. Los tests estandarizados que se habían elaborado con el fin de determinar los conocimientos de los estu¬diantes no sirvieron para casi nada cuando hubo que diagnosticar las necesi¬dades y valorar los avances de los niños menos favorecidos, cuyo desarrollo educativo se encontraba muy por detrás del de sus compañeros de clase media. Además, dichos tests eran relativamente inadecuados para discernir las dife¬rencias entre escuelas y/o programas, principalmente a causa de sus propie¬dades psicométricas y el alcance de sus contenidos. En lugar de determinar los resultados directamente relacionados con una escuela o un programa en con¬creto, estos tests determinaban, en el mejor de los casos, el grado de aprendi¬zaje, centrándose casi en los mismos rasgos que los tests de aptitudes (Kella¬han, Madaus Y Aiitsian, 1980).

La utilización de tests estandarizados planteó otro problema: un método de evaluación como éste se oponía a los preceptos del método tyleriano. Desde - el momento en que Tyler reconocía y enfatizaba las diferencias entre los ob¬jetivos de un lugar u otro, a este modelo le resultaría difícil adaptar a todo el ámbito nacional sus programas de tests estandarizados. Para ser comercial¬mente viables, estos programas regularizados debían olvidar ciertos objetivos bastante extendidos e importantes para ciertos lugares, en favor de otros que eran importantes para la mayoría de los distritos. Es más, había una escasez de información acerca de las necesidades y niveles de éxito de los niños menos afortunados, lo cual limitaba a los profesores a la hora de fijar objetivos de comportamiento que fueran significativos para este grupo de alumnos.

Los intentos de aislar los efectos del artículo 1 a través de la utilización de planes establecidos por grupos de control o experimentales fallaron, debido, principalmente, a la incapacidad de cumplir los requisitos de estos planes. Y las inspecciones in si tu realizadas por expertos —aunque fueron muy utili¬zadas por responsables gubernamentales— no resultaron aceptables como pri¬mera estrategia evaluativa porque se consideró que este método estaba falto de la «objetividad» y el «rigor» estipulados en la legislación de la ESEA. Cuando se informaba de que no se había llegado a ninguna conclusión, lo cual ocurría frecuentemente, se daba muy poca información acerca de los procedimientos empleados y, a menudo, no se proporcionaban datos sobre cómo se habían llevado a cabo. Frecuentemente, el énfasis puesto en las puntuaciones de los tests desviaba la atención del examen de los procedimientos o de su ejecución.

Como resultado de la creciente inquietud producida por los esfuerzos rea¬lizados en las evaluaciones con resultados siempre negativos, el Phi Delta Kappa creó el National Study Committee on Evaluation (STUFFLEBEAM y otros, 1971). Tras examinar el panorama, este comité concluyó que la evaluación edu¬cacional «era víctima de una grave enfermedad» y recomendó el desarrollo de nuevas teorías y métodos de evaluación, así como nuevos programas para pre¬parar a los propios evaluadores, Al mismo tiempo, empezaron a aparecer nue¬vas conceptualizaciones sobre la evaluación. PROVUS (1971), HAMMOND (1967), EISNER (1967) METFESSEL y MICHAEL (1967) propusieron una reforma del modelo Tyler. GLASER (1963), TYLER (1967) y POPHAM (1971), recomendaron los tests basados en criterios como una alternativa a tests basados en normas. COOK (1966) la utilización del método de análisis sistémico para la evaluación de programas. SCRIVEN (1967). STUFFLEBEAM (1967, 1971) y STAKE (1967) crearon nuevos modelos de evaluación que se alejaban radi¬calmente de los métodos anteriores. Estas conceptualizaciones reconocían la necesidad de evaluar las metas, examinar las inversiones, y analizar el perfec¬cionamiento y la prestación de los servicios, así como determinar los resultados que se desean (o no se desean) obtener del programa. También insistieron en la necesidad de enjuiciar el mérito o el valor del objeto de la evaluación. Los últimos años de la década de los 60 y los primeros de la de los 70 vibraron con las descripciones, discusiones y debates acerca de como debía ser conce¬bida la evaluación. Las unidades que siguen tratan en profundidad los métodos alternativos que empezaron a tomar forma en este periodo.

La época del profesionalismo

Aproximadamente en 1973, el campo de la evaluación empezó a cristalizar y a emerger como una profesión diferenciada. El campo de la evaluación ha avanzado considerablemente como profesión, aun¬que es instructivo considerar su desarrollo en el contexto del periodo anterior.

En aquellos momentos, como ya hemos explicado, los evaluadores se en¬frentaban a una crisis de identidad. No sabían muy bien cual era su papel, si debían ser investigadores, administradores de tests, profesores, organizado¬res o filósofos. Cualquier calificación especial que se les pudiera dar no resultaría clara. No existían organizaciones profesionales dedicadas a la evaluación entendida como especialidad, ni tampoco publicaciones especializadas a través de las cuales los evaluadores pudieran intercambiar información acerca de su trabajo. Esencialmente, no existía literatura acerca de la evaluación educacio¬nal, excepto trabajos inéditos que circulaban entre círculos de es¬pecialistas. Había muy pocas oportunidades de prepararse para ejercer un servicio evaluativo. Las normas claras para una buena práctica se veían con¬finadas a las encuestas educacionales y psicológicas. El campo de la evaluación era amorfo y fragmentado. Muchas evaluaciones estaban dirigidas por personal sin preparación, otras por investigadores metodológicos que intentaban sin éxito adaptar sus métodos a las evaluaciones educativas (GlIBA, 1966). Los estudios evaluativos estaban cargados de confusión, ansiedad v hostilidad. La evaluación educacional como especialidad tenía poca talla v ninguna dimensión política.

Con este telón de fondo, el progreso realizado por los evaluadores educa¬cionales para profesionalizar su especialidad durante los años 70 es totalmen¬te destacable. Algunas publicaciones, como Educational Evaluation and Policy Analysis, Studies in Evaluation, CEDR Quarterly, Evaluation Review, New Directions for Program Evaluation, Evaluation and Program Planning y Eva¬luation News, aparecieron en aquella época, y luego han demostrado ser ex¬celentes vehículos para recoger y difundir información acerca de las diversas facetas de la evaluación educacional. A diferencia de lo que ocurría quince años antes, numerosos libros y monografías tratan ahora exclusivamente de la evalua¬ción. De hecho, el problema actual no es encontrar literatura sobre la eva¬luación, sino seguir el ritmo de lo que se publica. El grupo Mayo 12, la División H de AERA, la Evaluation Network y la Evaluation Research Society han pro¬porcionado excelentes oportunidades para que pueda establecerse un inter¬cambio profesional entre personas relacionadas con la evaluación y otros pro¬gramas.

Muchas universidades han empezado a ofrecer por lo menos un curso de metodología evaluativa (distinguiéndola de la metodología investigativa). Unas pocas como la Universidad de Illinois, la Universidad de Stanford, el Boston College, la UCLA, la Universidad de Minnesota y la Universidad de Western Michigan— han elaborado programas para graduarse en evaluación. Durante siete años, la Oficina de Educación de los Estados Unidos patrocinó un programa nacional de preparación para el servicio evaluativo destinado a educadores especiales (BRINKERHOFF y otros, 1983), y otras organizaciones profesionales han ofrecido talleres e institutos que tratan distintos temas rela¬cionados con la evaluación. Se han fundado centros para la investigación y el desarrollo de la evaluación, entre los que se encuentran la unidad de evaluación del Northwest Regional Educational Laboratory, el Center for the Study of Evaluation de la UCLA, el Stanford Evaluation Consortium, el Cen¬ter for Instructional Research and Curriculum Evaluation de la Universidad de Illinois, el Evaluation Center de la Universidad de Western Michigan y el Center for the Study of Testing, Evaluation, and Educational Policy del Boston College. El estado de Louisiana ha establecido un sistema y un pro¬grama para la titulación de evaluadores, Massachusetts están trabajando actual¬mente en un programa evaluativo similar y Dick JOHNSON (1980) ha elabo¬rado un primer borrador de una guía telefónica de evaluadores y agencias de evaluación.

De un modo creciente, la especialidad est6 considerando la metaevaluación. Como ya se ha indicado, un comité (Joint Committee, 1981) formado por doce organizaciones profesionales, ha publi¬cado una clarificadora serie de normas para juzgar las evaluaciones de los pro¬gramas educativos, proyectos y materiales, y ha establecido un mecanismo (Joint Committee, 1981) para repasar y revisar las Normas y facilitar su uso. Adem6s, se han publicado muchos otros grupos de normas importantes para la evaluación educacional (Evaluation News, mayo de 1981). Y han aparecido muchas técnicas nuevas.

Este considerable desarrollo profesional de la evaluación educacional ha producido diversos resultados. Primero, al producirse un indudable aumento y mejora de la comunicación en la especialidad, ha aparecido también una enorme cantidad de «cháchara» (CRONBACH, 1980). Segundo, aunque la pre¬paración y titulación de evaluadores ha mejorado con el fin de que las institu¬ciones puedan disponer de servicios realizados por personas cualificadas, al¬gunos lamentan que este desarrollo pueda reducirse a una especie de club cerrado y exclusivista (STAKE, 1981). Tercero, la cooperación entre organiza¬ciones profesionales relacionadas con la evaluación educacional, promovida por el Joint Committee on Standards for Educational Evaluation, es un pro¬metedor pero frágil compromiso para fomentar la ejecución y utilización de trabajos evaluativos de alta calidad. Cuarto, mientras la creación de nuevas organizaciones profesionales ha incrementado la comunicación y reducido la fragmentación de la especialidad evaluativa, aún persiste una profunda divi¬sión entre la División H de AERA, la Evaluation Network y la Evaluation Research Society. Finalmente, aunque se ha incrementado la comunicación entre los partidarios de los métodos positivistas cuantitativos y los que proponen métodos fenomenológicos/cualitativos, existe, actualmente, el peligro de que se produzca una polarización entre estos dos campos.

CONCLUSIONES Y REFLEXIONES

A pesar de la creciente búsqueda de métodos adecuados, del incremento de la comunicación y el entendimiento entre los principales teóricos, y del desa¬rrollo de nuevas técnicas, la práctica actual de la evaluación ha cambiado muy poco en la mayoría de los casos. Está claro que es necesario renovar los es¬fuerzos para educar a los evaluadores en las nuevas técnicas, para poner a prueba e informar de los resultados conseguidos mediante estas nuevas téc¬nicas y para desarrollar técnicas adicionales. En todos estos esfuerzos, debe ponerse énfasis en conseguir que la metodología responda a las necesidades de los profesionales y de aquellos a quienes sirven.

Hemos presentado la evaluación educacional como una profesión dinámi¬ca y aún en desarrollo. Aunque se trata de una profesión aún inmadura, no hay duda de que poco a poco se va convirtiendo en una parte identificable del amplio aparato profesional y gubernamental de educación, salud y bienestar. La predicción que se solía hacer en los años 60, en el sentido de que la eva¬luación de programas formalizada era sólo una moda que pronto desaparecería, ha demostrado ser falsa, y hay fuertes indicios de que esta especialidad con¬tinuará creciendo en importancia, complejidad y valor. Los logros alcanzados desde el final de la década de los sesenta son importantes, pero aún existen muchas deficiencias obvias y son necesarias una investigación y evolución constantes.

• Propuesta del modelo de Ralph Tyler

Ralph W. Tyler desarrollé el primer método sistemático de evaluación educacional. Este surgió del trabajo que realizó, en los años treinta y a princi¬pios de los cuarenta, en el Eight-Year Study de la Universidad del Estado de Ohio (S1'11TH y TYLER, 1942). A partir de entonces, el profesor Tyler ha continuado desarrollando aspectos de la evaluación, principalmente a escala nacional, siguiendo la evolución de los programas educativos federales. El alcance del respeto que ha conseguido puede medirse, en parte, por el gran número de reputados evaluadores que han basado su metodología en las teorías tylerianas.

Antes de que Tyler publicara su modelo evaluativo en 1942, los estudios se centraban en el estudiante y en la valoración de los logros alcanzados por el estudiante. La evaluación era, por lo tanto, virtualmente idéntica a la valo¬ración. Tyler procuró poner el énfasis en una amplia gama de objetos educa¬tivos, como los currículos y las ayudas. También destacó la necesidad de establecer, clasificar y definir los objetivos en términos de rendimiento, como una etapa inicial del estudio evaluativo. La evaluación, pues, se convirtió en un proceso para determinar la congruencia entre estos objetivos y las ope¬raciones.

El concepto tyleriano ha sido a menudo aplicado con una estrechez de miras que Tyler nunca propugnó. Más significativamente, mientras Tyler ofre¬cía medios prácticos para proporcionar información durante el curso de una evaluación, la atención acabó fijándose en los datos (por lo general relacionados con los logros del estudiante), que fueron considerados válidos sólo cuando el programa había recorrido ya su ciclo completo. A pesar de las des¬ventajas de la evaluación concebida como un proceso terminal y del estrecho alcance asignado a los objetivos, el trabajo de Tyler permanece como uno de los grandes hitos en la historia de la evaluación concebida como ciencia.

Ralph W. Tyler es generalmente considerado el padre de la evaluación educacional. Existen, posiblemente, dos razones para ello. Primera: propuso, describi6 y aplicó un método ya desarrollado para la evaluación, algo que nadie había hecho antes. Y segunda: su metodología ha sido tan penetrante como influyente. Destacados estudiosos de la evaluación educacional, como Michael y Metfessel, Provus y Hammond, han llevado más allá el trabajo de Tyler, sin alejarse de su filosofia básica y de su tecnología.

En términos generales, Tyler consideraba que la evaluación debe determinar la congruencia entre trabajo y objetivos. TYLER llegó a esta conclusión tras su trabajo, en los anos treinta y principio de los cuarenta, en el Eight-Year Study de la Universidad del Estado de Ohio. Algunos años más tarde resumió sus concepciones en estas palabras:

El proceso de la evaluación es esencialmente el proceso de determinar hasta que punto los objetivos educativos han sido actualmente alcanzados mediante los programas de currículos y enseñanza. De cualquier manera, desde el momento en que los objetivos educativos son esencialmente cambios producidos en los seres humanos, es decir, ya que los objetivos alcanzados producen ciertos cambios deseables en los modelos de comportamiento del estudiante, entonces la evaluación es el proceso que determina el nivel alcanzado realmente por esos cambios de comportamiento.

Procedimiento de diseño evaluativo

La ventaja de la definición de evaluación basada en la congruencia es que procede de una base lógica organizada a partir del desarrollo de un programa. Tyler consideraba que la evaluación debía ser una etapa esencial de este desa¬rrollo. Además, consideraba que debían existir una serie de etapas lógicas que afianzaran el proceso de evaluación real. De acuerdo con Tyler, el procedimien¬to para evaluar un programa es el siguiente:

1. Establecer las metas u objetivos.

2. Ordenar los objetivos en amplias clasificaciones.

3. Definir los objetivos en términos de comportamiento.

4. Establecer situaciones y condiciones según las cuales puede ser demos¬trada la consecución de los objetivos.

5. Explicar los propósitos de la estrategia al personal más importante en las situaciones más adecuadas.

6. Escoger o desarrollar las apropiadas medidas técnicas.

7. Recopilar los datos de trabajo (en el caso de los programas educativos, deben referirse al trabajo de los estudiantes).

8. Comparar los datos con los objetivos de comportamiento.

Debe destacarse que la definición de evaluación de Tyler coincide mucho con estas etapas del procedimiento. Si el objetivo de un programa de currícula y enseñanza es producir un cambio en los modelos de comportamiento de los que se benefician del, entonces es necesario un método que mida el alcance del cambio. Antes de que esto suceda deben ser determinadas con cla¬ridad y definidas las «metas y objetivos». Dicho en términos de comporta¬miento, deben comprobarse los objetivos después de que se hayan establecido las condiciones apropiadas para su comprobación.

Tyler no diferenciaba entre metas y objetivos en su estrategia. De SUS escritos puede colegirse, de cualquier forma, que las metas de un programa eran ideales por los que había que luchar, mientras que los objetivos eran submetas que podían ser expresadas como entidades mensurables.

Ventajas del método tyleriano

Antes de que Tyler desarrollara su método, la evaluación educacional se había centrado casi exclusivamente en el estudiante. Los logros de los estu¬diantes eran la base de la evaluación del programa. Los logros, o los méritos, se basaban a veces enteramente en valoraciones como los tests y, ocasional¬mente, en una síntesis de varias valoraciones e impresiones subjetivas. En este método orientado hacia la valoración para descubrir el mérito de un programa, el estudiante era el principal foco de atención. Además, la evaluación se limi¬taba a aquellas variables que podían ser sometidas a valoración. El método tyleriano, en teoría, desplazaba su atención hacia otros aspectos del los estudiantes.

Las definiciones de los objetivos también implicaban criterios de evaluación. Cualquier evidencia válida acerca de los objetivos de compor¬tamiento debía ser concebida como un método válido de evaluación. Nunca estuvo especialmente interesado en los métodos que no utilizaban papel y lápiz, como la observación, las entrevistas y la valoración de los trabajos manuales y ejercicios de los estudiantes. Tyler proporcionó medios prácticos para la retroalimentación (término que él introdujo en el lenguaje evaluativo). Así, Tyler veía la evaluación como un proceso recurrente. La evaluación, según él, debía proporcionar un programa personal con información útil que pudiera permitir la reformulación o rede¬finición de los objetivos. Si se produce la modificación de los objetivos, debe realizarse la revisión correspondiente de los planes evaluativos. La estrategia de Tyler también permitió que evaluador con iniciativa pudiera examinar los datos más relevantes mediante el cual se desarrollaba el programa. De todas formas, cómo afirmamos más adelante, este aspecto potencialmente valioso del programa evaluativo nunca fue pro¬mulgado por Tyler ni puesto en práctica por sus inmediatos contemporáneos. Lo utilizaron otros .incluido Scriven (evaluación formativa) y Stufflebeam (evaluación del proceso), para resaltar la gran importancia de la evaluación, útil tanto para catalogar un proceso de un programa como sus resultados finales.

Tyler subrayó que un estudio evaluativo no necesariamente debía ser con¬siderado aislado de otros estudios similares. Creía que el valor real de la infor¬mación derivada de los estudios más tempranos debía ser utilizado para ayu¬dar a definir los objetivos, seleccionar las condiciones apropiadas para que pu¬dieran alcanzarse los objetivos propuestos y ayudar en la interpretación de los resultados que debían valorarse. Consideraba, por lo tanto, que un buen evaluador debía adquirir destreza para utilizar con habilidad los precedentes adecuados a la hora de realizar estudios evaluativos o desarrollar técnicas de valoración.

Como se ha dicho al principio, Tyler puso las bases del primer método sistemático de evaluación. Fue lo que más tarde se convirtió en el método «dirigido por objetivos», para desarrollar y controlar organizaciones o ciertos aspectos de las organizaciones. Uno de los aspectos más importantes de los métodos sistemáticos es su apariencia racional. En educación, concretamente, resultan atrayentes los conceptos derivados de las etapas sistemáticas, como formulación de objetivos, retroalimentación, evaluación continua y reciclaje (ba¬sado en la modificación de metas u objetivos). Además, el proceso parece ser útil para el profesor que desee tomar decisiones acerca del programa. Rara vez son necesarios los agentes externos, aunque el Eight-Year Study es una excepción importante.

Utilizaciones del modelo tyleriano

Tyler previó que su método evaluativo sería utilizado principalmente por profesores y elaboradores de currículos, Tras la aparición de los programas federales en los años sesenta, consideró igualmente que su método podía ser apropiado para evaluadores profesionales.

Aparte la modificación de currículos y la clasificación de objetivos, como se ha subrayado más arriba, el método Tyler es muy útil en clase. De cual¬quier manera, depende mucho de la agudeza del profesor que el método sea usado positivamente (la torna de decisiones para el perfeccionamiento de la educación debe continuar siendo la principal utilización de la evaluación, no importa cuál sea el alcance de la discrepancia existente entre los objetivos y los resultados del trabajo).

El método Tyler puede ser útil como guía de aprendizaje para el estu¬diante. Puede encargarse del d