A standard vizsgáztatás tapasztalatai Nagy-Britanniában
Részlet a szerző "Érettségi és felvételi külföldön" című most megjelent könyvéből
A standardizált vizsgákkal szembeni legfőbb igény a teljesítmény mérésének objektivitása. A szerző először a standardizáció és objektivitás összefüggéseit tárgyalja az angol A-szintű vizsgákra vonatkozó ilyen jellegű kutatási eredmények tükrében. Majd azt mutatja be, milyen szakmai és technikai megoldásokkal próbálják az évente változó vizsgázók teljesítményének standard minősítését fenntartani a skót vizsgarendszerben. Végül egy különösen nehéz szakmai problémára, a szóbeli vizsgák standardizációjának megoldási lehetőségeire tér át, megismertetve az olvasóval a cambridge-i nyelvvizsgáztatás sikeres tapasztalatait.
A hazai vizsgarendszert - sok más országéhoz hasonlóan - gyakran bírálják azért, hogy a belső vizsgák és az iskolai értékelés túlsúlya miatt országos szinten az eredmények nem mérhetők igazán össze. Azösszemérhetőség hiánya különösen a középiskolai teljesítményt is beszámító felvételi versenyvizsgákon okozhat indokolatlan minősítésbeli eltéréseket. Minthogy az érettségi reformját sürgető szakemberek döntő többsége a standard vizsgáztatást a modernizáció egyik kulcskérdésének tekinti, érdemes részletesebben is foglalkoznunk az ezzel kapcsolatos külföldi tapasztalatokkal.
Az objektív minősítés korlátai
A standard tudásmérés hívei körében gyakorta tapasztalható, hogy nemcsak az összemérhetőséget, hanem az objektivitást is a standardizáció attribútumának tekintik. Röviden szólva, úgy látják, hogyha standard vizsgákon mérik a tanulók tudását, objektív választ kapnak az iskolázás eredményességéről. Érdemes tehát megvizsgálni, hogy a standardizáció alapjait képező vizsgakövetelmények, illetve a teljesítményértékelés, mennyire állnak objektív alapokon.
A vizsgakövetelmények és a teljesítményértékelés "objektivitása"
Sokszor elfelejtjük, noha teljesen kézenfekvő, hogy a vizsgakövetelményeket mindenütt egyfajta értékdöntés alapján határozzák meg az oktatástervezők. Vagyis eldöntik, hogy mit fontos tudni és mit nem, illetve ami fontos, az milyen mértékben fontos. Ráadásul ezek a "fontos tudásról" szóló döntések időről időre változnak. Egy példával élve, a 60-as évek közepéig az euklideszi geometria még alaptéma volt a brit középiskola matematikatanításában és a vizsgakövetelményekben, 1996 után viszont teljesen periferikussá vált.
Mindebből két lényegi következtetés vonható le. Az egyik az, hogy mivel a vizsgakövetelmények meghatározása egy adott tudás fontosságáról szóló értékdöntés is egyben, nem lehet más, mint konkrét ésszubjektív. A másik, hogy mivel a standard vizsga egyik alapja, a "fontos tudásról" alkotott értékítélet koronként változik, a különböző időpontokban mért tudáseredmények közvetlenül nem összehasonlíthatók. Így nem adhatnak érvényes és objektív információt az iskolarendszer hatékonyságának változásairól sem. Ha ehhez hozzávesszük, hogy ezen az alapon még egy adott korcsoport teljesítményének értékelése sem objektív, minthogy az is értékítélet (pl. melyik vizsgafeladat hány pontot ér), akkor nem nehéz belátni, hogy az oktatási rendszer hatékonysága önmagában a vizsgaeredményekből nem ítélhető meg reálisan.
Joggal merül fel a kérdés, ha mindez így van, ha a standard vizsga nem is igazán objektív, és az eredmények csak egy adott korcsoporton belül összemérhetők, miért fogadják el mégis ezt a drágább vizsgáztatási eljárást bizonyos országokban. Természetesen a standard vizsga társadalmi elfogadottságának mindenütt van egy alapfeltétele, mégpedig az, hogy az értékelés kritériumai egyértelműek és nyilvánosak legyenek. Az egyéni életpályákat meghatározó, szelekciós célú felvételi vizsgák esetében csak ez teremtheti meg a vizsgába vetett bizalmat a felhasználók számára.
Az értékelési kritériumok elvben kétféle módon határozhatók meg: szakértői szintű teoretikus megközelítésben vagy tapasztalati alapon, a tanulók teljesítőképességének megfigyelése útján. A lényeg mindkét esetben az, hogy pontosan definiálják: mely kritériumoknak kell megfelelni egy meghatározott minősítési fokozat eléréséhez (pl. mit kell teljesítenie egy vizsgázónak ahhoz, hogy ötös osztályzatot kapjon). Az értékelési kritériumok mechanikus alkalmazásával azonban vigyázni kell, mert előfordulhat, hogy ha egy részteljesítményre adott minősítés meg is felel a kritériumoknak, adott esetben szemben állhat az egész teljesítmény holisztikus megítélésével.
A standard vizsgakövetelmények és a teljesítményértékelés "objektivitásával" kapcsolatos szakmai kételyeket egy olyan kutatás is igazolta (Cresswel 1996), mely az angol A-szintű vizsgák minősítési rendszerét és gyakorlati működését vizsgálta. A kutatás eredményeit azért közöljük részletesen, mert hasznos lehet tájékozódni arról, hogy milyen eljárásbeli mozzanatok és tantárgyi sajátosságok befolyásolják leginkább a standard vizsgák objektív minősítésének lehetőségeit.
Az A-szintű vizsgák minősítésének kutatási tapasztalatai Angliában
A kétfokozatú angol vizsgarendszerben elsősorban az A-szintű vizsgák minősítése alapján kerülhetnek be a jelöltek a felsőfokú intézményekbe. A minősítést egy bizottság végzi, megállapítva, hogy a sikeres vizsgázók - összes pontszámukat tekintetbe véve - az ötfokú skála melyik kategóriájába (A, B, C, D, E) sorolhatók. (A bukottak N vagy U minősítést kapnak.) A minősítés folyamata a következő lépésekből áll.
- A bizottság tagjai először elolvassák a vezető vizsgáztatók jelentéseit arról, hogy milyennek ítélték a jelöltek válaszait, mely kérdések bizonyultak nehéznek vagy könnyűnek a számukra.
- Utána áttekintik a vizsgázók pontszámait, és statisztikát készítenek a pontszámok eloszlásáról.
- Majd megvizsgálják néhány különböző minősítésű tanuló munkáját a teljesítményszint és az arra adott pontszám megfelelése szempontjából.
- Ezután egyeznek meg a bizottság tagjai arról, hogy hány pontnál húzzák meg a minősítési kategóriák ponthatárait, beleértve a bukáshatárt is.
A bizottsági üléseken nagyon sok az olyan szubjektív tényező, mely döntő hatással lehet arra, hogy mikor hol húzzák meg a bukáshatárt, illetve a minősítési kategóriák határait. Egy nagyobb tekintélyű bizottsági tag véleménye alapvetően befolyásolhatja a döntéseket. A bizottság tagjai maguk is tanárok, így sokszor többre értékelik a vizsgáztató tanárok véleményét, mint a pontszámok statisztikai eloszlását. Emellett az ellenőrzésre kiválasztott dolgozatokra adott tanári jegyeket vitás esetekben felül is bírálhatják.
Az említett kutatás éppen arra irányult, hogy kiderítse, mi befolyásolja a bizottsági tagokat leginkább abukáshatár és a minősítési kategóriák határainak a meghúzásában. Hét tantárgyi vizsgabizottság (fizika, matematika, történelem, általános ismeretek, kommunikációs ismeretek, számvitel, angol) tagjainak hat olyan alaptípusát azonosították, mely típusok mindegyike más hivatkozási tényezőt hangsúlyozott az érvelésében. A hivatkozási tényezők a következők voltak:
- a megismert tanulói vizsgamunkákból nyert tapasztalatok;
- más kvalitatív természetű információk (pl. értékelési kritériumok, a vizsgázók általános teljesítménye);
- a pontszámok statisztikai eloszlása;
- a megegyezés szükségessége;
- eljárási kérdések;
- a témához nem közvetlenül tartozó ügyek.
A hét tantárgyi vizsgabizottságban a minősítési kategóriák ponthatárait és a bukáshatárt befolyásoló hivatkozási tényezők kombinációi különbözőképpen alakultak. A fizikabizottságban például a vita 30%-ban a pontszámok statisztikai eloszlásához kapcsolódott, és csak kevesebb mint 5%-ban a megismert tanulói vizsgamunkákhoz. Az angolnál ez az arány éppen fordított volt. A másfajta kvalitatív információkra való hivatkozásoknak is magasabb volt az aránya ott, ahol gyakrabban hivatkoztak a megismert tanulói vizsgamunkákra (angol bizottság), és kevesebb ott, ahol a pontszámok statisztikai eloszlásának kérdése dominált a vitában (fizikabizottság). A kutatás elsőként leszűrhető eredménye úgy összegezhető, hogy az egyes bizottságokat a kvalitatív vagy a kvantitatív megközelítés dominanciája jellemezte.
A példákból is kitűnt, hogy a tantárgy természete alapvető hatást gyakorolt arra, hogy az adott bizottság a kvalitatív vagy a kvantitatív megközelítést részesítette előnyben. A kutatás második eredménye tehát az volt, hogy a kvantitatív természetű tárgyak (fizika, matematika) bizottságai főként a statisztikai adatokratámaszkodtak, a kvalitatív természetű tárgyak bizottságai pedig a megismert tanulói vizsgamunkákból, az értékelési kritériumokból és a csoportteljesítményből kiindulva a kvalitatív információkra alapoztak a döntésükben. Emellett ez utóbbi tantárgycsoporthoz tartozó bizottságok könnyebben hozták meg a döntésüket a minősítési kategóriák ponthatárairól is. Ebből arra következtethetünk, hogy a nyílt végű, komplex kérdésekből álló (pl. angol anyanyelvi) teszteket könnyebben lehetett értékelni a kategóriahatárok szempontjából, mint a sok részkérdésből összeállított (pl. fizika) teszteket.
Tekintve azonban, hogy mind a hét tantárgyi bizottságban vizsgáltak véletlenszerűen kiválasztott és különböző minősítésű tanulói vizsgamunkákat a minősítési kategóriák ponthatárainak megállapításához, a kutatók azt is megnézték, hogy milyen tényezők befolyásolták legjobban a bizottságokat e vizsgamunkák megítélésében. A bizottságok tagjainak erre vonatkozó válaszait a hivatkozott értékelési kritériumokmentén négy csoportba lehetett sorolni:
- a tanulói munka stílusa, szerkezete, a feladatmegoldás módja;
- tartalma;
- a teljesítmény konzisztenciája;
- affektív tényezők (pl. jó a vizsgamunka, de mégsem eléggé).
Ismét felmerül a kérdés, hogy az egyes tárgyak természete befolyásolja-e valamely értékelési kritérium preferenciáját. A válasz: igen. Például az általános ismeretek esetében csak 20%-ban hivatkoztak a bizottsági tagok a dolgozat tartalmára és 40%-ban bizonyos affektív tényezőkre. Így összesen csak 40% maradt olyan fontos kritériumokra, mint a konzisztencia, a stílus, a szerkezet és a feladatmegoldás módja. Alapjában azonban két szélső típusát lehetett megkülönböztetni az értékelőknek. Az egyik a teljesítmény konzisztenciájára helyezte a hangsúlyt, a másik pedig a stílusra, a szerkezetre és a feladatmegoldás módjára. Az első típus értékelői a zárt kérdésekből álló teszteket alkalmazó tárgyakhoz kapcsolódtak, a másik típusé pedig az esszékérdésekre alapozott tárgyak vizsgamunkáihoz. Ezzel együtt az összes tantárgyi bizottságban igen magas volt a konkrét kritériumot nélkülöző affektív tényezők aránya az értékelésben. Ez azt a kutatási előfeltételezést igazolta, hogy az értékelési kritériumok következetes alkalmazása helyett a bizottságok tagjai főként értékítéleteket hoztak.
A standard minősítés fenntartásának korlátozott lehetőségei
Mint már a bevezetőben és az angol A-szintű vizsgák kutatási tapasztalatainak bemutatásában is utaltunk rá, nemcsak az objektivitás tűnik túlzott elvárásnak a standard vizsgáztatással szemben, hanem a teljesítmények abszolút összemérhetőségének igénye is. Ez utóbbi ugyanis azt feltételezi, hogy ugyanazon minősítés ugyanazt a teljesítményt fedi minden évben. Ehhez azonban a követelményeknek megfelelő tesztfajtáknak és a minősítési kategóriák ponthatárainak sem lenne szabad változniuk évről évre, nem szólva a konkrét tesztfeladatokról és magukról a vizsgázókról.
Két lehetősége mégis van a standard minősítés korlátozott megőrzésének a tömeges vizsgáztatásban. A legbiztosabb, ha minden feladatot előtesztelnek, de ez igen drága és munkaigényes eljárás, ezért gyakoribb, hogy - mint az A-szintű vizsga esetében is láttuk - tapasztalt stábra bízzák a minősítési kategóriák ponthatárainak és a bukáshatárnak a megállapítását. Ez a művelet azonban nem független a vizsgázók teljesítményétől, illetve a vizsgázók számától (a vizsgázók számának növekedése nagyobb teljesítményszóródást eredményez), így csak akkor kerül rá sor, amikor a vizsga már befejeződött.
Noha számos probléma nehezíti a standard minősítés fenntartását a vizsgateljesítmények longitudinális összemérhetősége szempontjából, kialakult három szabály, melyet célszerű betartani.
- Ha a vizsga nehézségi foka nem változik, nem változhat a bukáshatár sem az előző vizsgaévhez képest.
- Ha a vizsgázók teljesítménye nem változik, még akkor sem változhat a bukottak aránya az előző évhez képest, ha változik a bukáshatár.
- A bukáshatárt két tényező befolyásolhatja: a vizsga nehézségi foka és a vizsgázók teljesítménye.
A standard minősítés fenntartásának korlátozott lehetőségeit, mint már jeleztük, a skót vizsgarendszer működési gyakorlatában mutatjuk be.
A skót vizsgarendszer minősítési eljárásai
Noha Skócia része Nagy-Britanniának, oktatásügye és jogrendszere más, mint Angliáé vagy Walesé. A vizsgáztatás egységes és állami kézben van. A kétfokozatú, a külső és belső értékelést kombináló, standard követelmény- és minősítési rendszerre épülő tantárgyi vizsgáztatás működéséért a Skót Vizsgatanács a felelős. A sikeres érettségi bizonyítvány - csakúgy, mint Angliában - belépőt jelent a felsőfokú tanintézetekben folytatható továbbtanuláshoz.
Nyilvánvaló, hogy egy olyan vizsgarendszerben, amely a külső és a belső iskolai értékelést kombinálja,fokozottan nehéz a vizsgateljesítmények standard minősítésének fenntartása. Ezért érdemes megnézni legalább az első vizsgafokozat, a tankötelezettség teljesítése után letehető 16+ vizsga példáján, hogy milyen minősítési eljárásokat alkalmaznak Skóciában a belső és a külső értékelés esetében.
A 16+ vizsgán a tantárgyaknak bizonyos teljesítményelemeit a tanárok értékelik. Például az angolban az írást, az olvasást és a beszédet; a matematikában pedig az ismeretet és a megértést, a gondolkodást és az alkalmazást, valamint a problémamegoldást. A tanárok belső értékelését a Skót Vizsgatanács ellenőrzi abból a szempontból, hogy a vizsgázók teljesítményére adott minősítések megfelelnek-e a központi kritériumoknak. Ha azt találják, hogy egy adott minősítés nincs kellő összhangban a központi értékelési kritériumokkal, megbízottat küldenek az iskolába, aki elmagyarázza a tanárnak, hogy mi a probléma, és újraértékelik a szóban forgó tanulói teljesítményt. Ez a fajta kombinált minősítési eljárás többféle együttes haszonnal is jár:
- növekednek a vizsgastandard megőrzésének esélyei;
- nem kell teljesen kivenni a tanárok kezéből az értékelést;
- célirányos továbbképzésben részesülnek azok a tanárok, akik még nem tudják szakmailag jól értelmezni az egységes minősítési kritériumokat.
A 16+ vizsgán azonban vannak olyan tantárgyi teljesítményelemek is, melyeket központi írásbelik alapján külsőleg értékelnek. Ilyen például a földrajzban az ismeret és megértés, vagy a kémiában a problémamegoldás. A központi írásbelik esetében más a minősítési eljárás menete, mint a belső értékelés során. A tanárok, miután minősítették tanulóik teljesítményeit, elküldik az eredményeket a vizsgatanácsnak. Ott állapítják meg a minősítési kategóriák határait, valamint a bukáshatárt. A tanári minősítések képezik ennek kiindulópontját, amennyiben a kapott adatok alapján nézik meg a pontszámok statisztikai eloszlását, kiszámolva, hogy mennyi azoknak a vizsgázóknak a száma, akik a tanárok minősítése szerint az egyes kategóriák határai közé esnek. Az utóbbi időben már főként erre a mutatóra támaszkodik a vizsgatanács, amikor a minősítési kategóriák határairól szóló döntését meghozza.
A tantárgyi vizsgateljesítmények összehasonlító mutatói Skóciában
Mint az eddigiekből kitűnt, a külső és a belső értékelést kombináló skót vizsgarendszerben sajátos módon próbálják elérni, hogy ugyanaz a minősítés ugyanazt a teljesítményt fedje. Egyfelől úgy, hogy az egységes minősítési kritériumok érvényesülését belső értékeléskor is ellenőrzik, másfelől pedig úgy, hogy a külső értékelésben is tekintetbe veszik a tanári minősítéseket. E két, egymást kiegészítő eljárás sikerét emellett évről évre monitorozzák a tantárgyi vizsgateljesítmények összehasonlításából nyert mutatók alapján.
A mutatók használata arra a tapasztalatból nyert előfeltételezésre épült, hogy akinek jó az összes vizsgatárgyában elért átlagteljesítménye, annak az egyes vizsgatárgyakban elért teljesítményei is jók (eltekintve persze a kivételektől). A vizsgázók átlagos összteljesítményének és az egyes tárgyakban elért teljesítményének az összehasonlításából nyert mutatóktól kettős hozamot vártak:
- megtudni, hogy mennyire voltak nehezek a tantárgyi vizsgák;
- megállapítani, hogy milyen mértékben sikerült megőrizni a standard minősítést.
1. táblázat Három év tantárgyi teljesítménymutatói
Tantárgy
|
1993
|
1994
|
1995
|
Angol |
0,2
|
0,22
|
0,15
|
Matematika |
-0,31
|
-0,37
|
-0,37
|
Kémia |
-0,28
|
-0,27
|
-0,27
|
Fizika |
-0,27
|
-0,34
|
-0,38
|
Biológia |
-0,10
|
-0,13
|
0,15
|
Földrajz |
0,16
|
0,11
|
0,18
|
Történelem |
0,07
|
-0,10
|
-0,07
|
Modern társadalomtudományok |
0,19
|
0,08
|
0,1
|
Vallástan |
0,08
|
-0,06
|
-0,15
|
Testnevelés |
nincs adat
|
0,1
|
0,08
|
Francia |
-0,49
|
-0,45
|
-0,22
|
Német |
-0,50
|
-0,45
|
-0,18
|
Olasz |
-0,30
|
-0,18
|
-0,22
|
Az összehasonlító táblázatban a pozitív számok a könnyű vizsgatárgyakat jelzik, és azt jelentik, hogy mennyivel voltak jobbak egy adott tárgyból a jelöltek a vizsgatárgyaikban elért átlagteljesítményükhöz képest. A negatív számok pedig a nehéz vizsgatárgyakra utalnak, mivel azt mutatják, hogy mennyivel voltak rosszabbak egy adott tárgyban az átlageredményükhöz viszonyítva.
A vizsgatárgyak nehézségi szintjének megállapításánál számos, teljesítményt befolyásoló tényezőt nem tudtak figyelembe venni (pl. a vizsgatárgyak tanulási idejét, a vizsgázók motivációinak vagy a tanítási-tanulási környezetnek a különbségeit). Ennek ellenére a mutatók megerősítik azt a tapasztalatot, hogy areáltárgyak és a nyelvek nehezebbek, mint a humán tárgyak.
A vizsgastandard megőrzése szempontjából azonban nagyon is sokatmondóak ezek a mutatók. Az ideális persze az lenne, ha a számok minden évben egyformán zérót mutatnának, jelezve, hogy a vizsgatárgyak és az egymást követő évek vizsgafeladatai azonos nehézségűek. Ez viszont azért is lehetetlen, mert a vizsgázók személye és száma évről évre változik. A kép azonban így is eléggé megnyugtató, hiszen
- az egyes tárgyak nehézségi foka nem változott jelentősen,
- a hasonló jellegű tárgyak (pl. fizika, kémia, biológia) nehézségi foka hasonló maradt.
- mutatók hasznosítása azonban túlmutat a vizsgastandard megőrzésével kapcsolatos helyzetfelmérésen. A monitorozás igazi jelentősége, hogy a mutatók segítségével igazodni lehet a korábbi évek minősítési standardjához. Ha túl nehéznek bizonyul egy vizsgatárgy, lejjebb viszik a bukáshatárt, vagy könnyítenek a feladatokon. Például 1995-ben könnyítették a francia és a német nyelvi vizsgákat, mert az előző években túl nehezek voltak az olaszhoz képest. A minősítési kategóriák ponthatárainak véglegesítésénél tehát az összehasonlító teljesítménymutatókat is tekintetbe veszik a skót vizsgarendszer értékelési gyakorlatában.
A szóbeli vizsgák standardizálásának lehetőségei
Könnyű belátni, hogy ha az írásbeli vizsgák standardizálásának is vannak korlátai, melyek az értékelés objektivitását és a teljesítmények összemérhetőségét érintik, akkor a szóbeli vizsgák standarddá tételét különösen nehéz szakmailag megoldani. Hogy melyek ennek a lehetőségei, a Cambridge-i Egyetem vizsgaközpontjában (Local Examinations Syndicate) kialakult nyelvvizsgáztatási gyakorlat alapján mutatjuk be.
A cambridge-i vizsgaközpontban a szóbeli nyelvvizsga régóta a vizsgáztatás része. A szóbeliség már az 1913-ban bevezetett első angolvizsgán [English as a Foreign Language (angol mint idegen nyelv): EFL] is nagy szerepet játszott, mely vizsgát azoknak a nem angol anyanyelvűeknek kellett letenniük, akik angolt akartak tanítani. A nyelvvizsga szóbeli részének tradicionális fenntartását a kilencvenes évek elején lefolytatott nagyarányú közvélemény-kutatás is igazolta, melyben a megkérdezett tanárok, egyetemi oktatók és jövőbeli vizsgázók 90%-a nyilatkozta azt, hogy a szóbeli kifejezőképesség tesztelése "kívánatos" vagy "nagyon kívánatos".
A jelenlegi tízféle EFL-vizsga, melyeken több mint 100 országban évente kb. 500 ezer jelölt vesz részt, minden szinten és profilban (pl. üzleti angol) tartalmaz szóbeli tesztet. A szóbeli vizsga 5 perctől (legalacsonyabb szint) 20 percig (legmagasabb szint) tart, melyen a beszédkészséget egy vagy több kritériumskálán értékelik. A szóbeli vizsgateljesítmények standard minősítését két tényező együtthatása útján próbálják biztosítani. E két tényező: a standard vizsgaforma és a vizsgáztatók hierarchiája.
A standard vizsgaforma
Az EFL-vizsgák majd 90 éves története folyamán a párban vizsgáztatás lett a standard vizsgaforma. Az évek során annyiban módosult, hogy míg korábban a vizsgáztatók és a jelöltek egyaránt párban voltak, mára a jelöltek száma páratlan lett. A két vizsgáztató alapvető szerepmegosztása szerint egyikük stimulálja és kontrollálja a beszélgetést, a vizsgaprofilnak vagy vizsgaszintnek megfelelő feladatrendszer keretei között tartja a jelöltek interakcióit. Emellett gondoskodik arról, hogy mindhárom jelölt megnyilvánulhasson, és teljesítményüket összességében, vagyis holisztikusan értékeli. A másik vizsgáztató többnyire kívül marad a beszélgetésen, mert az a fő feladata, hogy analitikusan, vagyis különböző szempontokból (pl. a retorikai funkciók érvényesülése) értékelje a jelöltek szóbeli kifejezőképességeit.
A hosszú évtizedeken át kifejlesztett szóbeli vizsgák anyagának összeállítása terén az utóbbi időben komoly erőfeszítéseket tettek arra, hogy az audiovizuális eszközökkel is megtámogatott feladatokat összehangolják, szintek és profilok szerint egymásra építsék. Minthogy az egyes vizsgafajták - a háromféle képességet (írás, olvasás, megértés) mérő írásbeli tesztelést is beleértve - több hétig tartanak, ugyanarra a szintre vagy profilra egymással egyenértékű szóbeli feladatvariációkat is ki kellett dolgozniuk. A feladatvariációk egyenértékűségét ellenőrző vizsgálatok jó eredményt hoztak. Egyben bizonyították, hogy a jelöltek teljesítményét nem befolyásolja lényegesen, ha a szóbeli vizsgát az írásbeli követi, és az sem, ha megelőzi azt.
A vizsgáztatók hierarchiája
A világon működő kb. 7000 igazolt EFL szóbeli vizsgáztatónak szigorúan tartania kell magát a szóbeli vizsga standard anyagához és értékelési kritériumaihoz. Ahhoz, hogy a velük szemben támasztott követelményeket a vizsgaközpont ellenőrizhesse, egyfelől rögzítették a vizsgáztatási szabályokat, másfelől létrehozták a szóbeli vizsgáztatók hierarchikusan felépülő regionális szakmai hálózatát. A regionális egységeken belül a főcsoportvezető ellenőrzi a többnyire 15 csoportvezetőt, ők pedig a kb. 30 vizsgáztatót, hogy a standard eljárást követik-e a vizsgáztatásban és az értékelésben. A vizsgáztatók, a csoportvezetők és a főcsoportvezetők kiválasztásában - a felelősség mértékének függvényében - egyre magasabb követelmények érvényesülnek. Vizsgáztató akkor lehet valaki, ha
- egyetemi végzettségű,
- legalább hároméves tanítási tapasztalattal rendelkezik,
- elismerten jó tanár,
- nem kevesebb mint 25, és nem több mint 65 éves,
- a megpályázott vizsgaszintnek megfelelő angolnyelv-tudással rendelkezik,
- úgy beszél, hogy megértik a világnak azon a területén, ahol vizsgáztat,
- nyelvtanilag pontosan fejezi ki magát,
- megfelelő kommunikációs képességekkel rendelkezik,
- meg tudja ítélni a jelöltek teljesítményét az adott vizsgaszint követelményeinek megfelelően.
A csoportvezetők esetében részben mások a feltételek, részben magasabbak a követelmények.Csoportvezető az lehet, aki
- legalább hároméves EFL szóbeli vizsgáztatási tapasztalattal rendelkezik,
- szabályszerűen vezeti a szóbeli tesztelést,
- a megadott kritériumok szerint értékeli a jelöltek tudását,
- határozott, de egyben türelmes,
- ismeri a felügyelete alá tartozó terület vizsgáztatási és tanítási gyakorlatát,
- állandó kapcsolatot tart a területi vizsgaközpont titkárságával,
- készen áll arra, hogy bármikor behívhatják a területi vizsgaközpontba,
- együtt tud dolgozni a területi vezetéssel.
A főcsoportvezetőknek a fentieken kívül egyéb követelményeknek is kell eleget tenniük. Csak akkor lehet főcsoportvezető valaki, ha
- igazoltan jó tervezési, szervezési és vezetési képességekkel rendelkezik,
- interperszonális kapcsolataiban hatékony és eredményes,
- az adott területen korábban csoportvezető volt,
- nincs más munkahelye vagy munkaköre ezen kívül.
A kiválasztás után alaposan kiképezik a megfelelő jelölteket, megismertetve velük a szóbeli vizsgáztatás tartalmi, formai és eljárási szabályait is. Majd monitorozzák és analitikusan, vagyis kritériumok szerinti pontozással értékelik a teljesítményüket (pl. hangosan és érthetően, az adott vizsgaszintnek megfelelően beszéltek-e, betartották-e az időt stb.). Sikeres vizsga esetén pedig beiktatják őket az új pozíciójukba. Korábban csak angol anyanyelvű vizsgáztatókat alkalmaztak, ma már azonban bárkit, aki megfelel a követelményeknek. Ennek az az oka, hogy oly sok vizsgáztatóra van szükség szerte a világon, hogy másképp nem is tudnák kielégíteni a vizsga iránt megnövekedett igényeket. A hierarchikusan felépített regionális szakmai hálózatoknak tehát igen nagy a jelentősége, mert ezáltal tudják biztosítani a standard szóbeli vizsgáztatás személyi feltételeit.
Felhasznált irodalom
Cresswel, M. J.: What Are Examinations Standards? The Role of Values in Large Scale Assessment. In The Effects and Related Problems of Large Scale Testing in Educational Assessment. Ed. by Zhang Houcan. Peking, 1996, International Association for Educational Assessment, 245-262.
Hargreaves, Peter: Establishing and Maintaining Standards in Large Scale Face-to-Face Speaking Test. InThe Effects and Related Problems of Large Scale Testing in Educational Assessment. Ed. by Zhang Houcan. Peking, 1996, International Association for Educational Assessment, 273-281.
Lawton, D.-Gordon, P.: Dictionary of Education. 1993, Hodder and Stoughton, 15-20., 31-35.
Long, Hamish A.: Maintenance of Standards in Public Examinations. In The Effects and Related Problems of Large Scale Testing in Educational Assessment. Ed. by Zhang Houcan. Peking, 1996, International Association for Educational Assessment, 282-290.
West, Anne-Edge, Ann-Stokes, Eleanor: Secondary Education Across Europe: Curricula and School Examination Systems. 1999, Centre for Educational Research, London School of Economics and Political Science, 84-110.