Olvasási idő: 
22 perc

Helyzetjelentés a teljes körű pedagógiai mérések nemzetközi gyakorlatáról

A tanulmány a közelmúltban lezajlott első hazai képességmérés kapcsán összefoglalja a teljes körű tudásszint- és képességmérések történetét. Részletesen bemutatja, hogy az egyes európai országokban milyen célokat követnek a mérések, és milyen módszereket alkalmaznak a mérések során. A szerző elemzi a nemzetközi mérési szakirodalomban használt fogalmakat, s kísérletet tesz egy egységes magyar terminológia megalkotására.

Az oktatómunka eredményességének kérdései régóta foglalkoztatják az embereket. Pedagógiatörténeti érdekességként tartják számon például azt, hogy időszámításunk előtt már jó kétezer évvel Kínában szigorú vizsgáztatásnak vetették alá az állami tisztviselők korábbi ismeretszerzésre alapozott szakértelmét;Szókratészről is feljegyezték, hogy a tanulók szóbeli értékelését a tanulási folyamat részének tekintette.[1] AzAmerikai Egyesült Államok ún. Szövetségi Oktatási Hivatala már a 19. század közepén megbízást kapott arra, hogy "mutassa fel, melyek a különféle készségekben tanúsított előrehaladás feltételei".[2] 1883-ban pedig megjelent két olyan könyv is, amely sok szempontból a pedagógiai mérések tudományos megalapozásának tekinthető; G. Stanley Hall és Sir Francis Galton munkáit[3] ugyanis az azóta eltelt több mint egy évszázad alatt is szüntelenül idézik a szakemberek.

A pedagógiai értékelés történetének ugyancsak meghatározó állomásaként tekinthető 1905-ben a francia Binet és Simon által kifejlesztett intelligenciavizsgálatok bevezetése.[4] A 20. század további történeti adatai is jelzik, hogy a kutatókat változatlanul foglalkoztatta az értékelés feladata és az elvégzett értékelés megbízhatósága; 1913-ban például átfogó elemzés készült a matematika érdemjegyekkel jelzett minősítéseinek tapasztalatairól, 1936-ra pedig - hasonló tantárgyvizsgálati témákban - összejött egy egész kötetnyi[5] kutatási beszámoló is, elsősorban angol-amerikai országok szakembereitől.

A korai harmincas években megkezdte működését a chicagói egyetemen Ralph W. Tyler, akit a szakma mindmáig a pedagógiai értékelési gyakorlat megalapítójának tekint. Munkája során nemcsak a tanulók kognitív teljesítményeire terjedt ki a figyelme, hanem az ezeket nagymértékben befolyásoló szociális jellemzőkre is. A hatvanas évektől a német nyelvű országokban is hozzákezdtek a szakemberek apedagógiai diagnosztikai értékelési módszerek népszerűsítéséhez. 1967-ben jelent meg AmerikábanMichael Scriven munkája, amelyben megfogalmazta a klasszikus különbségtételt a szummatív és a formatív értékelés között.[6] 1975-ben pedig egy szakmai dokumentumában maga az Európa Tanács is szót emelt atanulási teljesítmény vizsgálatának szükségességéért.[7] S ehhez az elkötelezettségéhez a szervezet a további évtizedekben is ragaszkodott. (1993-ban például az Európa Tanács szervezte az oktatáskutatási eredményeket áttekintő finnországi konferenciát, és ennek anyagát kötetben is megjelentette. Két évvel később pedig egy tankönyvekkel foglalkozó konferenciával tette ugyanezt.)

Az Amerikai Egyesült Államok 1965-ben hatályba lépett oktatási törvénye a jog eszközeivel elsőként adott hangot annak az elvárásnak, hogy mind az általános, mind a középfokú oktatásban meghatározó szerephez kell juttatni a pedagógiai-szakmai értékelés folyamatát. E döntésüket követően a pedagógia illetékesei már 1966-ban önálló szakmai-publikációs fórumot is teremtettek a pedagógiai értékelési tevékenységnek: útjára indították az azóta évente négy alkalommal megjelenő Journal of Educational Measurement című periodikájukat, melynek szerkesztésében jelenleg a kaliforniai egyetem szakemberei töltik be a vezető szerepet. (Természetesen a folyóirat európai és más országok oktatási vizsgálatairól is közöl beszámolókat.) Az sem véletlen, hogy Amerikában a jóval később, 1992-ben létrehozott ún. "Országos felmérés a tanulmányi haladásról" program az alkalmazott vizsgálati módszerekről - a hátrahagyott évtizedekre visszatekintve - már azt is megállapíthatta, hogy azok általában kedvező hatással voltak az amerikai iskolákban végzett értékelési folyamatok pedagógiai hatékonyságára[8] is.

A teljes körű pedagógiai értékelés gyakorlatának kialakítása az európai országokban

A 20. század utolsó évtizedeiben - az amerikai példák hatására - Európában is mind több országban váltak rendszeressé a különböző korosztályokra vonatkozó, egész országra kiterjedő pedagógiai értékelő vizsgálatok. Az Egyesült Királyságban e folyamat első és meghatározó állomásaként tartják számon az 1976-os esztendőt, mert az oktatási minisztériumon belül ekkor hoztak létre egy önálló teljesítményértékelő szervezeti egységet (rögtön voltak természetesen olyanok, akik kijelentették: "az értékelési eljárások politikai eszközök a kormány kezében!").[9] Az 1988-as brit oktatási reformtörvény a korábban csak alternatív eljárásként számon tartott, a nemzeti alaptanterv tudásfelmérő tesztjeire alapozott felméréseket évenkénti országos, azaz teljes körű gyakorlatként kötelezővé tette minden 7, 11, 14 és 16 éves gyerek számára. Skóciában 1977-ben fogadták el az "Assessment for All" (azaz "az értékelést mindenkinek") programot, melynek folytatásaként - alig hét esztendővel később - meg is kezdték az egy-egy korcsoportot, illetve iskolafokozatot érintő "Standard Grade" vizsgálatok rendszeresítését is. E felmérések a mindenkori célcsoportok matematika- és angoltudásának, ez utóbbi vonatkozásában pedig az olvasás-, írás- és beszédkészség szintjének leírására vállalkoztak olyan kritériumok figyelembevételével, amelyek lehetővé tették a korosztályok egyes tagjai közötti különbségtételt is.

Hollandiában 1986-ban született meg az a kormánydöntés, amely az alapfokú iskolai tanulmányok befejezésekor kötelező jelleggel előírta egy minden tanulóra kiterjedő diagnosztikus teszt elvégeztetését és - a további tanulságok levonása céljából - országos kiértékelését. Két évvel később az érettségi vizsgákat is országos követelmények alapján kezdték megszervezni. Ez a gyakorlat mindmáig érvényben van.

Svédországban már a hetvenes években kidolgoztak különféle, mérésre és értékelésre alkalmas teszteket, skálákat[10], és az 1978/1979-es tanév során javaslatot tettek egy országos méretű vizsgálat lefolytatására is. Erre 1989-ben került sor, amikor is a második, illetve az ötödik osztályos tanulók körében az anyanyelv, a matematika és az idegen nyelv, azaz az angol nyelv oktatásának hatékonyságát mérték. Ettől az évtől számítják annak az országos értékelő programnak a megindítását, amely azóta is folyamatosan a viták kereszttüzében áll. Egyes ellenzői szerint a felmérések feladatai nagyon nehezek, ezért túlságosan megterhelik a gyerekeket, és így nem tekinthető hitelesnek az eredmények alapján kialakított kép. (Az 1993/1994-es tanévben egy majdnem teljes körű - az ország 286 településére kiterjedő - felmérés keretében az oktatás eredményessége és a ráfordított erőforrások nagysága közötti arányokat tárták fel.)

Írország is országos méretű értékelési programba kezdett 1989-ben, amelybe minden tizenkét, illetve tizenöt esztendős tanulót bevontak. Finnország is ekkor kerített sort eddigi egyetlen, a közoktatásban tanulók bizonyos korcsoportjaira vonatkozó teljes körű vizsgálatára. A finn szakemberek azt azonban nem szűnő büszkeséggel emlegetik, hogy náluk már több mint százéves múltra tekint vissza az - a helsinki egyetem által kidolgozott, az egyetemi felvételi eljárás során alkalmazott - érettségi teszt, amely anyanyelvből és matematikából vizsgálja meg a jelentkezők intellektuális érettségét egy nagyon alapos, hatórai munkát igénylő felmérés segítségével.

Franciaországban egyes állítások szerint[11] a pedagógiai értékelések kérdése komoly szerepet játszott az 1968 májusában kitört diákzavargásokban. A tüntető, sztrájkoló és még a barikádokra is felmenő diákok ugyanis a megkezdett oktatási reformok ellenében - egyebek között - a hagyományos osztályozási-értékelési gyakorlat visszaállítását követelték a közép- és felsőfokú oktatási intézményekben. Ezért Franciaországban ezután sokáig nem adtak teret a másutt már mind jobban népszerűsödő értékelési módszereknek. A nemzetközi gyakorlat hatására azonban a pedagógiai értékelés itt is egyre inkább a társadalmi változások egyfajta jelzőberendezésévé vált, és 1989 óta polgárjogot kapott az évenkénti rendszerességgel elvégzett, nagy populációkat érintő felmérések tapasztalatainak tudományos igényű elemzése.[12]

Egy-egy ilyen franciaországi felmérés - például az, amelyet mindjárt az indulás évében az alapfok második évfolyamán, illetve a középfok kezdő, azaz hatodik évfolyamára belépő tanulók körében végeztek -, 1,7 millió tanulóra terjedt ki. Azóta évről évre bővítik a vizsgálatokba bevont tanulók körét; a felmérések már nem csupán az általánosan képző ágazatok diákjait érintik, hanem fokozatosan sorra kerülnek a szakmai líceumok különböző évfolyamai is, és az anyanyelvi, matematikai, történelmi ismeretek mellett újabban rákérdeznek az ipari technológiák, a gazdaságtan és a természettudományok egyes kiválasztott témáival kapcsolatos, illetve a szakmai képzettség részeként számon tartott ismeretekre is. A felmérések elvégzésekor minden alkalommal hangsúlyozzák, hogy a tájékozódás nem a tanulók szelektálására szolgál.[13] A cél elsősorban az, hogy az iskolák, a pedagógusok az így nyert információkat a továbbiakban messzemenően figyelembe vehessék a szakmai munkájukban.

A thaiföldi Yomtienben 1990-ben megtartott, sok helyütt, sok vonatkozásban idézett Oktatást mindenkinekcímű világkonferencia határozatai között is szerepel a tanulási eredmények megismerése jelentőségének megfogalmazása. Az itt hivatkozott beszámoló[14] szerzője elismerőleg szól az India Andra Pradesh államában elvégzett, minden alapfokú oktatási intézményt érintő, teljes körű mérésről, melynek határozott célja az országos és helyi döntéshozók szakszerű tájékoztatása volt az oktatás helyzetéről, a pedagógiai gyakorlat eredményeiről, hiányosságairól, és amely jó alapot teremtett a regionális oktatási rendszerek átszervezésének megkezdéséhez. A tartományban e vizsgálat tapasztalatai alapján vezettek be néhány évvel később új tankönyveket, alakították át a pedagógusképzés intézményrendszerét és gyakorlatát stb.

Ez a példa is jól szemlélteti az értékelési szakemberek azon megállapítását, mely szerint az iskolai rendszer átalakítása céljából hozott intézkedések első lépését igen gyakran a pedagógiai értékelés jelenti, mert ennek segítségével lehet az adott helyzet pontos leírására vállalkozni.[15]

A rendszerváltás után nem sokkal, 1991-ben Romániában is országos méretű értékelési programot indítottak el az oktatási minisztérium irányításával. A programba először minden iskola 8. és 12. évfolyamon tanuló diákját vonták be, később ezek a felmérések kiterjedtek az 5. és a 9. évfolyamok tanulóira is.

Szlovák Köztársaság oktatási minisztériuma 1992-ben kidolgozott egy olyan tervezetet, amely az ország oktatási rendszerének 2000. évig történő átalakítása során mind az alap-, mind a középfokú oktatásban meghatározó szerepet szán a tanulók teljes körű értékelésének, illetve az itt nyert tapasztalatok országos szintű összegzésének. (Ennek egyik eredményeként például nemrégiben a szlovákiai magyar pedagógusok és szülők lapjában[16] megjelent egy beszámoló, a magyar iskolákban már második éve folytatott, ún. KALIBRO-féle tanulói tudásszintmérésről, melyet népszerűsítői szeretnének országos méretűvé tenni. A módszer igénybevételéért azonban az iskoláknak egyszeri részvételi díjat kell fizetniük. Az érdekeltek ezzel magyarázzák azt, hogy sok iskola nem vállalja e sok eredményt ígérő gyakorlat alkalmazását.)

1993 júniusában a finnországi Yyväskyläben, az Európa Tanács által szervezett, az oktatásban végzettkutatásokkal foglalkozó konferencián a különböző országokból érkezett résztvevők összegezték[17] a korábbi évtizedek értékeléssel kapcsolatos tapasztalatait. Itt fogalmazták meg azt az akkor már általánosnak mondható észrevételt is, hogy az értékelés gyakorlatában egyre inkább tért hódítanak a diagnosztikus és a formatív értékelés módszerei, melyek egyértelműen a tanítás és a tanulás segítésére törekednek és kifejezték azt az elvárást, hogy az ilyesfajta értékelési tevékenység megismertetését mielőbb be kell építeni a tanító- és tanárképzés anyagába.

Az értékelési folyamatok fogalom- és eszköztáráról

Az értékelési programok jelölésére a nemzetközi pedagógiai szakirodalomban három kifejezést is használnak: evaluation, measurment, assessment. E három kifejezés jelentéstartalma sok tekintetben megegyezik egymással, több vonatkozásban azonban jól érzékelhetőek a közöttük lévő különbségek is. Azevaluation kifejezést elsősorban a hagyományos iskolai, számokban is kifejezhető értékelés jelentésben alkalmazzák; a measurement (felmérés) kifejezés jelentésébe általában beleértik a tapasztalati megfigyelések, észrevételek valamilyen szintű és eszközrendszerrel történő szervezettségét is, míg azassessment kifejezés alkalmazója az egyes egyének vagy adott rendszerek bizonyos jellemzőinek értékelésére is vállalkozni kíván.[18] Hasonló jelentésben idesorolható még az examining (tanulmányozás, illetve vizsgáztatás), valamint a teszt kifejezés is. (Ez utóbbi fogalmat általában a nagy megbízhatóságot nyújtó formatív eljárásokkal végzett értékelések leírására alkalmazzák.[19]) Sőt, az értékelés témakörében már egy új, máshol egyáltalán nem használt, így nehezen azonosítható fogalom is megszületett; ez adocimológia, amely használói magyarázata szerint a különféle vizsgálati és osztályozási eljárásokkal elvégzett tudásmérések pontosságának tudományos tanulmányozását, illetve kiértékelését jelenti.[20] E bőség ismeretében érdekes nyomon követni a pedagógiai értékelés történetében e fogalmak sajátosdinamikáját is.

Kezdetben és azóta is még mindig nagyon gyakran az értékeléssel elsősorban mint az evaluation fogalommal jelölt tevékenységeknek a példáival találkoztunk/találkozunk a szakirodalomban. E fogalommal általában a tanulók (más esetekben az oktatók) tanulmányi teljesítményének valamilyen szempontú értékelésére utalnak; az értékelő tevékenység valamilyen tananyag, intézmény vagy szervezet alapos átvizsgálatára is utalhat.[21] Figyelemre méltó, hogy használói a fogalomba beleért(het)ik az értékeléssel kapcsolatostudományos, illetve igen gyakran nyilvánvalóan politikai tevékenység egyes elemeit is.

A képzési módszerek és azok hatékonyságának felmérésére újabban egyre szívesebben alkalmazzák a szakmában az assessment kifejezést. Ehhez a fogalomtartalomhoz ugyanis mintha könnyebben hozzákapcsolhatók lennének - a módszerre jellemző speciális kritériumok között - a tapasztalt jelenségek és az adott társadalom bizonyos jelenségei közötti összefüggésekre vonatkozó megállapítások is. Egyes vélemények szerint[22] ez a kifejezés újabban háttérbe szorítja az evaluationt. Az assessment kifejezéssel jelzett értékelési tevékenység kapcsán is el kell mondani, hogy - akár az evaluation - az is elvégezhető az oktatási folyamatban részt vevő tanárok által a saját területükön éppúgy, mint átfogóan, akár egy egész országra vonatkozó távlatok kialakításához szükséges információk megszerzésének igényével. Annál is inkább, mert egy-egy ország oktatási, illetve értékelési rendszere között kétségkívül létezik kapcsolat, ha ez az összefüggés nem is annyira egyértelmű, mint amilyennek azt a teoretikusok szeretik feltételezni.[23]

Az értékeléselmélet más szakemberei[24] viszont ez utóbbit, vagyis az assessment fogalmat az előbbinél bizonyos értelemben "keskenyebb", a harmadik, gyakran használt fogalomnál, a measurmentnél viszont jóval szélesebb jelentésűnek tekintik. Sokak szerint az is növeli a használhatóságát, hogy többdimenziós mátrix-mintavételi technikát alkalmaz, s a felvétel során elsősorban a minőségi tényezőkre fokuszál, mindig pontosan megfogalmazza, hogy a vizsgált program elérte-e az általa kitűzött célokat, és jelzi a szükséges továbblépés irányát is.[25] A tesztmódszereket alkalmazó felmérések emlegetése esetében viszont általában az evaluation kifejezéssel találkozunk[26], mint ahogy az értékelési funkciókat megjelölő diagnosztikus, formatív és szummatív minősítések is túlnyomórészt az evaluation kifejezéshez kapcsolódnak. Mivel pedig a diagnosztikus értékeléseket minden esetben valamilyen csoportosítás szerint végzik, a szakemberek annak külön jelentőséget tulajdonítanak, hogy ezek a csoportok iskolák közöttiek, iskolán vagy osztályon belüliek-e. Amikor viszont a kutatók a diagnosztikus jelzőt az assessment kifejezéshez kapcsolják[27], akkor - láthatóan - a széles vagy teljes körű felméréseknek azon feladataira hivatkoznak, amelyek segítségével pontosan meg lehet állapítani az elvárt és a valós eredmények közötti eltéréseket, és fel lehet ismerni ezen eltérések okait is.

A teljes körű értékelések hatékonyságának biztosítása sem a munka megszervezése szempontjából, sem szakmailag-módszertanilag nem egyszerű feladat. A sok-sok szempont között az alábbi nyolcat például minden esetben be kell tartani:[28]

  • figyelni kell a felmérés várható következményeire (tanulók és tanárok vonatkozásában egyaránt);
  • biztosítani kell a vizsgálatok korrektségét;
  • számításba kell venni a teljesítménynek a feladatokra gyakorolt hatását, vagyis a transzfer és a generalizáció jelenségét;
  • a lehetőség szerint kognitív teljességre kell törekedni;
  • a feladatoknak összhangban kell lenniük a tantervi anyaggal;
  • a feladatoknak megfelelő minőséget kell képviselniük;
  • a kérdéseknek értelmeseknek kell lenniük;
  • szem előtt kell tartani a költség és a hatékonyság összefüggéseit is.

Tudomásul kell venni ugyanakkor azt is, hogy az országos méretű információszerzést biztosító pedagógiai-szakmai programok mindenütt egyre inkább az általános érdeklődés középpontjában állnak. A politikacsinálók, az adófizetők, az üzleti élet irányítói ugyanis nemcsak kíváncsiak az ilyen felmérések eredményeire, hanem határozott elképzeléseik, elvárásaik vannak az általuk szükségesnek ítélt normákkal, azaz a kívánatos teljesítménnyel kapcsolatban is[29] a tapasztalatok alapján elkezdendő jobbítás szándékával.

Footnotes

  1. ^ The International Encyclopedia of Education. Editors in chiefs: Torsten HusÚn ž T. Neville Postletwaite. 1994, Pergamon.
  2. ^ Encyclopedia of Education Evaluation (Concepts and Techniques for Evaluating Education and Training Programs) Scarvia B. Anderson ž Samuel Ball ž Richard T. Murphy ž Associates, 1971.
  3. ^ G. Stanley Hall: The Study of Children és Sir Francis Galton: Inquiry into Human Faculty and Development című munkáiról van szó. Ez utóbbi mű - a kérdőívhasználat bevezetésével - egyben a formatív értékelés előfutárának tekinthető.
  4. ^ Educational Research, Methodology and Measurement: An international Handbook. Edited by John P. Keeves. Advances in Education. 1988, Pergamon Press.
  5. ^ Hartog - Rhodes: Monograph on Anglo-American Research.
  6. ^ Handbook of Educational Ídeas and Practoces. General editor Noel Entwistle. 1990, Routledge.
  7. ^ Pupil Assessment and the Role of Final Examinations in Secondary Education. Edited by Erkki Kangasniemi - Sauli Takal. Council of Europe, 1995.
  8. ^ Az amerikai értékelési gyakorlatról - egyéb érdekességek mellett - sok mindent megtudhatunk Gordon Győri János: Az irodalomtanítás elmélete és gyakorlata az Amerikai Egyesült Államokban I. című cikkéből Új Pedagógiai Szemle, 2001. november.
  9. ^ Education and Development: Tradition and Innovation. Volume one. Concepts, Approaches and Assumption. Edited by James Lynch - Celin Modgil - Sohan Modgil.
  10. ^ L. Educational Research, Methodology and Measurement.
  11. ^ Encyclopédie de l’évaluation en formation et en education. Guide pratique. André de Peretti, Jean Boniface et Jean-André Legrand. 1998 ESF.
  12. ^ L. a Le Monde de l’ Éducation 1990 No. 167 Ce que savent vos enfants, 1991. No. 181. L’evaluation, illetve 1994. No. 218 Des tests pour tous című cikkeit.
  13. ^ A szakképzés területén végzett értékelési témáknak az előtérbe kerülésében komoly szerepet játszott Gerard Figari, a grenoble-i Pierre Mendes France Egyetem neveléstudományi intézetének professzora is.
  14. ^ Education and Development: Tradition and Innovation. Volume One. Concepts, Approaches and Assumtions. Ed. by James Lynch - Celia Modgil - Sohan Modgil. 1992, Cassel.
  15. ^ Education and Development.
  16. ^ Katedra, 1999. márciusi szám.
  17. ^ Pupil Assessment and the Role of Final Examinations in Secondary Education.
  18. ^ The International Encyclopedia of Education.
  19. ^ A CEDEFOP (a Közép-európai Szakképzés-fejlesztési Központ) illetékeseit is foglalkoztatják ezek a kérdések; az intézmény fordítási és terminológiai osztálya az alapfogalmak tisztázása érdekében 2000-ben kibocsátott egy ezekkel foglalkozó Glosszáriumot is. Az itt megjelentetett kifejezések értelmezéséhez olvasói segítséget is kértek.
  20. ^ Encyclopedie de l’évaluation en formation et en education.
  21. ^ The International Encyclopedia of Educational Evaluation. Ed. by Herbert J. Walberg - Geneva D. Haertel. Advances in Education. 1990, Pergamon Press.
  22. ^ Elliot W. Eisner: Reshaping assessment in education: some criteria in search of practice. Journal of Curriculum Studies, 1993/3.
  23. ^ Pupil Asessment and the Role of Final Examinations in Secondary Education.
  24. ^ Encyclopedia of Education Evaluation.
  25. ^ Lásd Elliot W. Eisner id. közleményét.
  26. ^ Handbook on Formative and Summativ Evaluation of Student Learning. Ed. by Benjamin S. Bloom - J. Thomas Hastings - George F. Madans. 1971.
  27. ^ The International Encyclopedia of Educational Evaluation.
  28. ^ Delwyn L. Harnisch - Linda Mabry: Issues in the development and evaluation of alternative assessment. Journal of Curriculum Studies, 1993/2.
  29. ^ Gert J. van den Brink: The development of proposals for nationwide atteinment targets: the Dutch case. Journal of Curriculum Studies, 1993/5.