Voici ce qu'avait recommandé le groupe national d'experts avant la mise en oeuvre des évaluations nationales en Grande-Bretagne :
1. Les évaluations nationales devraient être fondées sur une combinaison d'évaluation par les enseignants et de tâches fixées à l'extérieur, appelées tâches d'évaluation standardisée (SAT).
2. L'objectif principal de l'évaluation, outre celui de l'évaluation à l'âge de 16 ans, devrait être de fournir un feed-back fréquent sur l'apprentissage des élèves afin que l'enseignement puisse s'adapter à leurs besoins (c'est-à-dire être formatif) ; en particulier, la composante évaluation des enseignants devrait être fondée sur une évaluation formative, et il est nécessaire soutenir le développement de l'évaluation formative par les enseignants.
3. Les évaluations aux quatre étapes de la scolarité devaient être inter-reliées ; pour ce faire, il serait nécessaire que les spécifications du programme d'études ne soient pas simplement des objectifs finaux pour les différents niveaux de scolarité, mais des objectifs échelonnés selon un schéma de progression commun à tous les groupes d'âge.
4. Les programmes scolaires devraient être exprimés selon des critères de performance mais sans chercher à classer les élèves.
5. Les différents thèmes principaux de chaque matière scolaire devraient être spécifiés dans un ensemble de critères rassemblés en 10 niveaux pour donner la progression attendue dans l'apprentissage dans la matière. Le niveau 2 devrait faire figurer les attentes pour l'enfant moyen de 7 ans, le niveau 3 devrait correspondre aux attentes pour un enfant moyen de 9 ans, et ainsi de suite tous les 2 ans, de sorte qu’un enfant moyen de 16 ans pouvait se situer entre les niveaux 6 et 7, laissant une marge pour permettre des résultats différents à tout âge.
6. Les résultats de l'évaluation dans chaque matière devraient être présentés en termes de résultats globaux et en petit nombre - de préférence pas plus de quatre – selon des composantes correspondant à profil pouvant représenter les différents domaines de réussite dans une matière. Par exemple, la lecture, l'écriture, l'expression orale et l'écoute pourraient constituer trois composantes du profil en anglais ; le traitement des nombres et des données, l'espace et la forme, l'algèbre et les recherches mathématiques peuvent être quatre composantes en mathématiques. Le profil de l’élève dans chaque matière, plutôt qu'un seul résultat, devait être considéré comme le résultat le plus important sur le plan éducatif.
7. Les évaluations standardisées définies à l'extérieur de la classe ne devraient pas nécessairement être des tests écrits formels ; en fait, pour les plus jeunes, ils devraient ressembler davantage à des travaux de classe soigneusement conçus pour que les élèves produisent des écrits ou des oraux qui fournissent les preuves nécessaires selon les différentes composantes du profil. Les évaluations standardisées devraient être notées par les enseignants des élèves concernés.
8. Le résultat des évaluations nationales pour chaque enfant aux quatre étapes de la scolarité devrait être déterminé en combinant les résultats des évaluations standardisées et les évaluations des enseignants. La combinaison devrait se faire par une modération par groupe d’enseignants, chaque groupe ayant devant lui les résultats des évaluations standardisées pour chaque école, les résultats de l'évaluation des enseignants avec des échantillons de travail, et les résultats moyens nationaux pour les évaluations standardisées. Il est recommandé que les résultats des évaluations standardisées fixent les moyennes et les écarts pour chaque école mais que, dans ce cadre, les écoles déterminent par elles-mêmes les résultats pour chaque élève.
9. Les résultats ne devraient pas être publiés à l'âge de 7 ans ; pour les enfants plus âgés, les résultats individuels ne devaient être accessibles qu'aux parents et à l'élève, mais les résultats scolaires globaux pourraient être publiés dans le cadre d'un rapport complet sur l’école et d'une déclaration de l’autorité locale à partir de l'interprétation des résultats par rapport au bassin d'emploi de l'établissement.
Ce rapport a suscité de nombreux débats. Dans l'ensemble, la profession enseignante l'a accueillie favorablement, en partie parce que les enseignants s'attendaient à quelque chose de bien pire. La première ministre Thatcher a exprimé son malaise, et certains universitaires ont été critiques. En particulier, nombre d'entre eux ont critiqué le fait que ces évaluations nationales imposaient un modèle unique d'apprentissage à tous les élèves et dans toutes les matières.
Ce n'était pas l'intention du TGAT : le groupe d’experts avaient l'intention d'utiliser le cadre d'une manière très souple. En fait, par-delà les débats et controverses, le groupe avait élaboré son propre modèle à partir de l'expérience des membres dans une grande variété d'initiatives et d'institutions d'évaluation. Leur objectif central était de respecter et de renforcer l'apprentissage des élèves et le rôle professionnel des enseignants, tout en soutenant une évaluation rigoureuse et valable pour satisfaire aux exigences légitimes de la responsabilité publique.
Source :
Dans la série:
La Loi sur la réforme de l'éducation de 1988 fut t l'aboutissement d'un long débat qui s'est développé pendant au moins 20 ans. L’un des motifs est le désir du ministère de l’éducation d'exercer une influence sur les programmes scolaires. Le second est le fait que les hommes politiques de Droite et de Gauche exprimaient des inquiétudes face au déclin supposé du pays, certains se concentrant principalement sur le déclin économique et d'autres sur la perte des valeurs et de la culture traditionnelles.
Voici ce qu'avait recommandé le groupe national d'experts avant la mise en oeuvre des évaluations nationales en Grande-Bretagne : 1. Les évaluations nationales devraient être fondées sur une combinaison d'évaluation par les enseignants et de tâches fixées à l'extérieur, appelées tâches d'évaluation standardisée (SAT). 2. L'objectif principal de l'évaluation, outre celui de l'évaluation à l'âge de 16 ans, devrait être de fournir un feed-back fréquent sur l'apprentissage des élèves afin que l'enseignement puisse s'adapter à leurs besoins (c'est-à-dire être formatif) ;
Les évaluations nationales en Grande Bretagne : (3) Priorité excessive aux évaluations standardisées
Cinq mois après la publication du rapport du groupe national d’experts en 1987, le ministre de l'Éducation annonçait qu'il acceptait la plupart des recommandations, même si cet engagement était formulé en termes vagues à plusieurs reprises. Les groupes mis sur pied pour élaborer les recommandations des programmes scolaires devaient travailler selon le cadre à dix niveaux en utilisant une approche fondée sur ces critères.
En 1990 et 1991, les premiers essais à grande échelle des nouvelles évaluations standardisées pour les enfants de 7 ans ont eu lieu. Contrairement aux tests chronométrés de courte durée, ils exigeaient beaucoup de préparation et d'organisation de la part des enseignants. Pour beaucoup de ceux qui n'avaient jamais planifié un travail thématique avec des objectifs clairs servant à évaluer l'apprentissage des élèves, les tests étaient à la fois exigeants et perturbants.
Le rapport du groupe national d’experts avait pourtant attiré l'attention sur le danger d’une lourdeur excessive et avait recommandé une réduction des composantes du profil entre les matières et d’une matière à l’autre pour produire un plus petit nombre de composantes génériques ou de base notamment pour les groupes d'âge les plus jeunes. Cette question ne fut jamais abordée. Les ministres et les fonctionnaires considéraient les matières choisies comme évidemment nécessaires, et toute théorie globale qui aurait pu servir à définir leurs limites,
Il semble que les contenus des recommandations du groupe d’experts (TGAT) n’ont guère étaient pris au sérieux par les décideurs politiques. Par ailleurs, si le nouveau système avait été moins compliqué et ambitieux, il aurait pu être plus robuste et, par conséquent, aurait pu mobiliser plus efficacement les acteurs de l’éducation. En résumé, il est clair que cette inefficacité dans la mise en œuvre possède plusieurs causes.
Comments