Olvasási idő: 
41 perc

A tudományos folyóiratok értékelése

1. BEVEZETÉS

Az alapkutatással foglalkozó tudományos kutató nehéz helyzetben van, amikor kiváló teljesítményét szeretné igazolni a laikus társadalom felé. Nincs vita, ha eredményei sokakat érintenek, hatása az érintettekre jelentős. Ilyen eredmény azonban kevés van, néha a legjelentősebb, korukat meghaladó eredmények kevesek által olvasott, obskúrus folyóiratokban jelennek meg, egy, a legtöbb ember által érthetetlen nyelven. Az eredményesség bemutatása azonban rendszerint nem puszta kívánság. A kutatók és a befogadó intézmények kemény csatákat vívnak a szűkös forrásokért; állást, ösztöndíjat, előléptetést csak a legjobbak kaphatnak, nem véletlen, hogy a kérdés folyamatosan napirenden van a Magyar Tudomány hasábjain (pl. Csaba, Szentes és Zalai, 2014). Sajnálatos módon ugyanakkor a kutatók munkásságának megítéléséhez évtizedek kellenek, miközben a kutatónak most lenne szüksége értékelésre. Az összeegyeztethetetlen időhorizontok miatt bizonyos kompromisszumokra kényszerülünk: a kutató cikke helyett a befogadó folyóirat átlagos cikkét, azaz tulajdonképpen a befogadó folyóiratot értékeljük. Könyvek értékelésére ez a módszer természetesen alkalmatlan.

A folyóiratok értékelése azonban nem csak a szerzők számára fontos. Segíti a kezdő kutatókat abban, hogy hol kezdjék az irodalom megismerését, mik a megbízható források, illetve, hogy kész cikkeiket hol közöljék. E döntés fontosságát aligha lehet túlbecsülni, hiszen a publikálás helye az elsődleges tényezője annak, hogy a munkánk hány hivatkozást kap a jövőben (Peng, Zhu, 2012). Végül, de nem utolsósorban az értékelés hasznos támpont lehet a könyvtárosok számára, hogy a folyamatosan szűkülő források és az ezzel párhuzamosan emelkedő előfizetési díjak mellett a lehető legjobb ár-érték arányú folyóiratcsomagot fizessék elő.

A két feladat: a cikkek és a folyóirat értékelése nem ugyanaz a feladat, de külön-külön a két problémára is számtalan megoldást találunk. A sok megoldás sajnos azt is jelenti, hogy igazán jó és elfogadott megoldás nincs. A kiterjedt irodalmat elsősorban a széles körben használt hatástényező vagy impakt faktor (IF) kritikái dagasztják, miközben több ígéretes módszer csak az elmúlt pár évben kapta meg az őket megillető figyelmet.

A továbbiakban bemutatjuk a fontosabb értékelő módszereket, rávilágítunk erősségeikre és gyenge pontjaikra. Mindenekelőtt azonban fontos kitérnünk a folyóiratok értékelésének és az értékelésekből levonható következtetéseknek a  korlátaira.

 

2. AZ ÉRTÉKELÉS KORLÁTAI

Az eredmények közlésének menete tudományterületenként eltérő, és saját területem, a közgazdaság-tudomány esete valószínűleg nem jellemző általánosan. Itt a kézirat először bírálatlan formában, mint műhelytanulmány érhető el, majd a jobb eredményeket elfogadja közlésre egy folyóirat (Kóczy, 2014). Nem mondhatjuk, hogy a cikket ekkor hozták nyilvánosságra, hiszen az már korábban elérhető volt: a folyóirat ehhez a peer-review-t, a szakértői bírálatot teszi hozzá, mintegy ráütve a pecsétet, hogy „megfelelt”. Természetesen nem mindegy, hogy melyik folyóirat pecsétje kerül rá: a magasabb presztízsű lapokban egész egyszerűen magasabb szintű szerkesztői munka folyik, ami a szerkesztőség szűrőjén átjutott cikkek eredményességén, hatásán mérhető le.

Következik-e ebből, hogy a jobb folyóiratban elfogadott cikk jobb? Természetesen nem. A közölt cikkek egy része semmilyen további hatást – például hivatkozást –  nem tud felmutatni. Ez ritkábban, de a jobb lapokban is előfordul (Laband, 2013). Másrészt egy gyengébb lapban megjelent cikk is kaphat sok hivatkozást. Ez örvendetes a szerző számára, de kár, hogy nem tudta meggyőzni egy magasabb presztízsű folyóirat szerkesztőit, hiszen akkor várhatóan még több hivatkozást kapna. Sajnálatos, ha egy szerző nem tudja helyesen felmérni az eredmény jelentőségét, hiszen ezért az értékeléskor esetleg nagy árat kell fizetnie.

Mi a helyzet a könyvekkel? Hazánkban ma is sokan tekintik a könyvet a tudományos munka koronájának. Egy könyv értéke, presztízse felbecsülhetetlen – a szó szoros értelmében. Mivel a szerző mellé nem teszi oda a nevét két tucat vezető tudós a világ minden tájáról, igazából senki sem tudja, hogy a könyv miféle szakmai megmérettetésen esett át, senki sem vállal garanciát a könyv minőségére. Hiába a kiváló szerző, szakkönyvekben sokkal több elírást, pontatlanságot, sőt hibát találni. A közgazdászok közül az ír könyvet, aki nem tud cikket írni, vagy aki ily módon szeretné a jövedelmét kiegészíteni. Az eredeti kutatási eredményeket tartalmazó könyv nem jellemző, a szerzők a mennyiség helyett a minőségre törekednek.

A kutatóknak a publikációikat befogadó folyóiratokon keresztüli értékelése tökéletlen, de szükséges módszer (Frey, Rost, 2010). Egy közepes európai egyetem álláshirdetésére 100 fölötti pályázat érkezik, és hasonló számokkal dolgozik a Nemzeti Kutatási Fejlesztési és Innovációs Hivatal (NKFIH) a posztdoktori pályázat kapcsán. Üdvös volna minden pályázó anyagát részleteiben megismerni, de erre nincs lehetőség. A folyóiratok értékelése a gyors, bár kissé pontatlan segítség a hatékony értékelésben.

 

3. A FOLYÓIRATOK ÉRTÉKELÉSÉNEK MÓDSZEREI

Alapvetően két iskolája van a folyóiratok értékelésének: kérdőíves és hivatkozás-alapú.


3.1. Kérdőíves értékelés

A kérdőíves értékelés (például Malouin, Outreville, 1987) során megkérdeznek egyetemi professzorokat, innovációs szakembereket vagy éppen doktorandusz hallgatókat, hogy szerintük melyek a fontos vagy éppen értékes lapok, mely folyóiratokat olvassák rendszeresen.

A kérdőíves értékelésnél a probléma már a megkérdezettek kiválasztásával kezdődik. Kérdezzünk meg minden kutatót? Szükséges-e valamilyen módon súlyozni a „kis- és nagyfogyasztók”, azaz például doktoranduszok és tudományos kutatók véleményét? Mennyire érzékeny az értékelés a megkérdezettek földrajzi elhelyezkedésére? Hasonlóak vagy nagyon eltérőek az értékelések (Axarloglou, Theoharakis, 2003)? Vajon a válaszadók képesek a tudományos értékeket elkülöníteni egyéb szempontoktól?

Ezekre a kérdésekre nem mindig adhatunk kedvező válaszokat. Bár az American Economic Association tagsága lefedi a közgazdászok színe-javát, ha a vizsgálat (Axarloglou, Theoharakis, 2003 ) csak a kutatók egy szisztematikusan kiválasztott csoportjára vonatkozik, akkor egyes folyóiratok vagy akár teljes tudományterületek mellőzve lesznek. A ma általánosan vezető lapnak tartott Review of Economic Studies és az Econometrica közül az első kifejezetten tiltakozásból jött létre, míg utóbbit a kor vezető lapjainak a matematikai módszerektől való elzárkózása tette erőssé.

A kérdőíves felméréseknek jellemzője, hogy az eredmény különösen kedvező az egyesületi folyóiratok számára – elsősorban a megkérdezett egyesület folyóirataira nézve. Ez aligha meglepő: nyilvánvalóan az ismert lapok között említi a kutató azt a folyóiratot, amit évente többször a kezébe vesz, még ha  bele sem olvas. Ugyanakkor, minőségüktől függetlenül nyilvánvaló hátránnyal indulnak a specialista, szűkebb tudományterülettel foglalkozó folyóiratok.

A különböző intézmények által deklarált folyóiratlisták rendszerint valamilyen hivatkozáson (és egyéb hasonló jegyzékeken) alapuló rangsorok, melyet a készítők szubjektív értékelése módosít kissé. Érdekes Hudson (2013) munkája, aki különböző hivatkozásalapú módszereket és több intézményi rangsort vet össze ökonometriai módszerekkel.


3.2. Hivatkozásanalízis

A hivatkozásanalízis során, ahelyett, hogy megkérdeznénk a kutatókat, meglessük, hogy hogyan használják a folyóiratokat. Az elgondolás lényege, hogy a szerzők a hivatkozásokkal elismerésüket fejezik ki egy korábbi eredmény, illetve szerző felé; a sok hivatkozást kapó cikket tehát sokan elismerik. Elmondhatjuk tehát, hogy a cikk értékes?

A hivatkozásanalízis egyik kritikája, hogy egy hivatkozás nem egyértelműen pozitív, több oka is lehet (Kóczy, 2010):

  • Konkrét és felhasznált eredményre vagy információra hivatkozunk.
  • Más által már sikerrel használt módszert alkalmazunk – az ismert írásra való hivatkozás révén könnyebben megértik a saját dolgozatot.
  • Bemutatjuk az új eredmények fontosabb előzményeit.
  • Látszólag hasonló kutatásra hivatkozunk, hogy tisztázzuk a hasonlóságokat és különbségeket, vagy elmagyarázzunk, hogy miért nem a korábban javasolt módszert alkalmazzuk.
  • Taktikus hivatkozás egy remélt bíráló (lazán) kapcsolódó munkáira, hiszen a szerkesztők gyakran a hivatkozási lista alapján kérnek fel bírálókat.
  • Taktikus hivatkozás, hogy a hivatkozott szerző felfigyeljen az írásra és pozitívan ítélje meg.
  • Taktikus hivatkozás a bíráló által figyelmünkbe ajánlott művekre.
  • Önreklám: hivatkozás kevésbé kapcsolódó saját írásokra is, hátha így új olvasókhoz jutnak el (van Raan, 2008).

A felsoroltak közül szűkebb értelemben véve csak a legelső tekinthető hivatkozásnak, de az első négy típus mindegyike a hivatkozott mű, míg a taktikus hivatkozások jellemzően a hivatkozott szerző érdemei miatt születtek. Érdemen nem feltétlenül értünk pozitív hivatkozást. Míg egy szerző munkásságának értékelése szempontjából fontos, hogy a művét pozitív összefüggésben idézzék, egy folyóirat jelentőségét egy negatív idézet is erősíti. A „negatív reklám is reklám”, mondhatnánk, de ennél fontosabb, hogy egy jelentéktelen folyóiratban megjelent hibás vagy hiányos eredményt nem érdem korrigálni, tehát már önmagában az említés mutatja a hivatkozott forrás jelentőségét. Összegezve tehát: a hivatkozás minden esetben az idézett forrás jelentőségére, vagy az idézett cikk értékére, hasznosságára utal.

A hivatkozásanalízis implicit feltételezése, hogy a szerzők minden felhasznált eredmény forrására hivatkoznak, de felesleges, fent „taktikusnak” nevezett hivatkozásokat nem helyeznek el. További feltételezés, hogy amennyiben egy eredmény több forrásból is elérhető, akkor az eredetire, a legjobbra, vagy, ha ilyen nincs, akkor mindegyikre hivatkoznak (Smith, 1981). Gyakran előfordul, hogy az elsődleges eredmény nehezen olvasható, vagy akár nehezen hozzáférhető helyen jelent meg, s kényelmi okokból a hivatkozás egy másodlagos közlésre utal, ráerősítve a folyóiratok értékelésére. Így, bár nem szabad elfeledkezni az értékelés korlátairól, a folyóiratok sorrendjét ez vélhetőleg nem befolyásolja.

 

4. A HIVATKOZÁSANALÍZIS MÓDSZEREI

Az alábbiakban áttekintjük a folyóiratok értékelésének hivatkozásokon alapuló módszereit.


4.1. A hivatkozások száma

Amennyiben minden hivatkozás értékes, minél több hivatkozást kap egy mű, annál elismertebb.

Az egységnyi idő, jellemzően egy év alatt megjelent hivatkozások száma (citation counts – CC), értelemszerűen a folyóirat által kapott összes hivatkozás száma.

Azt mondjuk, hogy egy értékelő módszer mérettől független, ha egy folyóirat megduplázása nem változtatja meg az értékelését. A hivatkozások száma természetesen nem független a mérettől, hiszen a megduplázott folyóirat kétszer annyi hivatkozást kap. Mondhatjuk, hogy a hivatkozások száma elfogult a nagy folyóiratok javára.

További kritika, hogy míg egy új folyóirat csak néhány évfolyam, míg egy régi lap akár több évtized cikkeire kaphat hivatkozásokat. Például a közgazdaság-tudományban egy-egy cikk akár évtizedek múlva is kaphat hivatkozásokat, anatómiában száz évvel korábbi cikkekre is gyakorta hivatkoznak (Cameron, 2005). Az úgynevezett felezési idő (cited half-life) – ami azt mutatja meg, hogy átlagosan mennyi idő alatt érkezik meg a hivatkozások fele – sok elméleti lapban 10 feletti. Mondhatjuk tehát, hogy a hivatkozások száma elfogult a régi lapok iránt. Ez az elfogultság valamivel könnyebben elfogadható, és sajnos sok értékelési módszer sajátja.


4.2. Hatástényező – impakt faktor

A hatástényező vagy ismertebb nevén az impakt faktor (IF) a Thomson Reuters[1] által évente megjelentetett mutató, mely megadja, hogy egy, a folyóiratban megjelent cikk az első két évben várhatóan hány hivatkozást kap. A pontos definíció ettől egy kicsit eltérő: a hatástényező az adott évben a folyóirat előző két évben megjelent cikkeire érkezett hivatkozások és az adott évben megjelent cikkek számának hányadosa.

Vegyünk egy példát: a folyóirat 2014-ben 100 hivatkozást kapott. A 100 hivatkozásból 5 a 2014-ben, 32 a 2013-ben, 17 a 2012-ben, a többi a korábbi években megjelent cikkekre hivatkozik. 2013-ban a folyóirat 15, 2012-ben pedig 13 cikket közölt. Ekkor a hatástényező (32+17)/(15+13)=1,75.

Garfield már az 50-es években hivatkozási adatbázist épített, a mai Web of Science elődjét. A rendelkezésre álló adatbázis aztán lehetőséget adott különféle érdekességek kiemelésére. Garfield a gyorsan forgó, aktuális, „forró” témákat és az azoknak otthont adó folyóiratokat kereste, s ennek meghatározására vezette be a hatástényezőt (Garfield, 1955), amelyet ma is elterjedten használnak – részben tévesen – a folyóiratok értékelésére. Mivel gyakorlatilag évtizedek óta elérhető, a folyóiratok értékelésének de facto standardjává vált. Ebből a státuszából az elmúlt két évtized robbanásszerűen fejlődő tudománymetriai irodalma, a megfogalmazott kritikák garmada, alternatív mértékek tucatjai sem tudták elmozdítani.

Mi a probléma az impakt faktorral? Szinte az a kérdés, hogy mi nem probléma! Az impakt faktorral kapcsolatban számtalan kritika fogalmazódott meg az évek alatt (Amin, Mabe, 2000), és ugyan ma már ismert egy axiomatikus leírása is, ez csupán rögzíti az IF tulajdonságait (Bouyssou, Marchant, 2011). Kezdjük azzal, hogy az impakt faktor – a Garfield cégéből kinövő Insititute for Scientific Information, jelenleg a Thomson Reuters publikálta – értékeihez csak az előfizetők férhetnek hozzá. (A nagyobb kiadók folyóiratai feltüntetik aktuális IF-értéküket, néha ranghelyüket is.) Azok a kutatók, illetve kutatóhelyek azonban nem, vagy csak korlátozottan férnek hozzá az IF-értékekhez, ahol elsősorban szükség lenne rá. Az alábbiakban három csoportba foglaljuk az impakt faktor kritikáit (Glänzel, Moed, 2002; Ha, Tan és Soo, 2006).

4.2.1. Technikai problémák

Egy folyóirat nem „kap” automatikusan impakt faktort. Az impakt faktor előfeltétele, hogy a folyóirat tudományos közleményeit indexeljék,[2] ami  költséggel jár. Miközben a nagyobb kiadók „felnőttkorba” ért lapjai mind bekerültek már a „klubba”, a független kiadású, esetenként igen színvonalas lapoknak jellemzően nincs IF-értéke. A nem angolszász világból származó vagy nem angol nyelvű lapok hiánya és rossz szereplése széles körben dokumentált (Archambault, Vignola-Gagné, Côté, Larivière és Gingrasb, 2006). Természetesen a fenti hányadost bármely, akár a „hiányzó” folyóiratra is ki lehetne számolni. Ez az érték azonban nem hivatalos, tehát olyan, mintha nem is lenne, mert a bibliográfiai adatbázisokban csak a hivatalos értéket tüntetik fel. Ennek egyik oka lehet, hogy a hivatalos impakt faktor számolásakor csak a Thomson Reuters által indexelt folyóiratokból érkező hivatkozások számítanak. Hudson, (2013) a különböző módszerek összehasonlításakor az IF és a SCImago azonos módon, de más adatokból számított „average two year cites” mutatója között mindössze 0,91 korrelációt talált. Ahhoz, hogy egy, ebbe a körbe nem tartozó lap értékét kiszámítsuk, az összehasonlíthatóság végett például figyelmen kívül kell hagyni a lap önmagára való hivatkozásait (Vanclay, 2012). Egy szélesebb körben vizsgált IF értelemszerűen nagyobb lesz.

Míg egyes folyóiratok esetében a hiányuk a probléma, az sem szerencsés, ha lapok mindenféle kritika és korlát nélkül kerülnek be az adatbázisba. Az IF ugyanis nem tesz különbséget, nem súlyoz két kapott hivatkozás között, jelenjenek meg azok egy vezető tudományos folyóiratban vagy éppen a Ludas Matyiban. A kevésbé rangos lapokban ráadásul gyakrabban előfordul a másodlagos, harmadlagos forrásra való hivatkozás, az ilyen lapok túlsúlyba kerülése esetén az IF a tudományos úttörőség helyett a disszemináció mérőszáma lesz.

A hányados nevezője sem mentes az ellentmondásoktól. A megjelent cikkek számába ugyanis csak a tudományos cikkek számítanak bele, a számításból kimaradnak ugyanakkor például az olvasói levelek (Didierjean, 2002). Érdekes módon az olvasói levelekre érkező hivatkozások is beleszámítanak a hányados számlálójába. A hivatalos és az ezektől megtisztított impakt faktor között néha igen nagy, az orvosi folyóiratok 40%-ában 10% feletti, 5%-ában 40% feletti az eltérés (Amin, Mabe, 2000). A furcsa definíció tehát jelentősen torzítja az adatokat, ráadásul folyóiratonként más-más mértékben. Egyes folyóirat-szerkesztők vagy kiadók szeretik kihasználni ezt a kiskaput, és olyan írások, melyeket más lap esetleg kutatási cikként közöl, itt beleférnek az olvasói levél kategóriájába. A Journal to Field Impact Factor (JFIS) (Van Leeuwen, Moed, 2002) bezárja ezt a kiskaput azzal, hogy ugyanazokat az írásokat vizsgálja darabszám és hivatkozások szempontjából, illetve a kapott számot a szakterületi átlaghoz igazítja.

A technikai problémák között említendő, hogy az IF kiszámításához felhasznált adatokban rengeteg a hiba, elírás, különösen a hivatkozó cikkekben, így az IF valójában egy nagyon pontatlan mutató, noha a három tizedes feltüntetése éppen az ellenkező benyomást kelti (Vanclay, 2012).

4.2.2. Tudományterületi hatások

Az impakt faktor teljesen alkalmatlan különböző tudományterületeken született publikációk összehasonlítására. Teljesen figyelmen kívül hagyja az eltérő hivatkozási szokásokat, vagy akár a területek méretét. Egy kisebb területen született meghatározó publikáció, amire szinte minden cikk hivatkozik, kevesebb hivatkozást kaphat, mint egy sokkal nagyobb terület kevésbé kiemelkedő cikke. Az impakt faktor arányos a tudományterület méretével, azaz a nagyobb területen arányosan nagyobbak az impakt faktorok (Jemec, 2001). A terület méretének dinamikája sem elhanyagolható. Egy gyorsan bővülő terület impakt faktora magasabb (Ha et al., 2006).

Tudományterületenként eltérő a hivatkozási intenzitás, azaz az egy cikkben hivatkozott cikkek átlagos száma. Az impakt faktor arányos a hivatkozási intenzitással, azaz két (viszonylag izolált) terület közül a magasabb hivatkozási intenzitásúban, ceteris paribus az IF is magasabb lesz.

A már korábban említett felezési idő tudományterületenként és publikációs típusonként is eltérő. A nagyobb felezési idejű területeken a hivatkozásoknak kisebb része esik a vizsgált kétéves ablakba. A publikációk és hivatkozások vizsgálatához rögzített ablak kétéves hossza egy önkényes paraméter, ma már a Thomson Scientific is közli az ötéves impakt faktort. Ez a változat továbbra sem használható a különböző „sebességű” tudományok folyóiratainak összehasonlítására, viszont a „lassabb” tudományokon belül alkalmasabb egy rangsor felállítására. Hasonló hatás figyelhető meg az áttekintő cikkek, kutatási cikkek és kutatási gyorsjelentések összehasonlításakor, így egy tudományterületen belül is torzulhatnak az értékek az egyes folyóiratok jellemző publikációs formátuma miatt. A hivatkozási felezési idő hatástényező (citation half-life impact factor – CHAL) a folyóiratonként különböző, a hivatkozások felezési idejének megfelelő ablakot vizsgál (Sombatsompop, Markpin és Premkamolnetr, 2004).

Összegezve jelentős torzulás figyelhető meg, például az élettudományokban hatszor akkora IF-értékeket találunk, mint a matematika vagy a társadalomtudományok területén (Amin, Mabe, 2000).

4.2.3. Manipuláció

Az IF eddig felsorolt kritikái furcsa, kedvezőtlen tulajdonságokra világítanak rá, illetve korlátozzák használhatóságát mint objektív, rangsoroló mérési eredmény. Mindezek ellenére az IF komoly karriert futott be, és a folyóiratokat elsődlegesen az IF szerint rangsorolják. Így egy szerkesztő vagy kiadó számára fontos cél, hogy a folyóirat impakt faktora lehetőleg minél magasabb legyen. Manipulációról akkor beszélünk, ha a szerkesztő vagy kiadó tudatosan olyan eszközökhöz nyúl, melyek célzatosan növelik az adott lap hatástényezőjét. A manipuláció lehetősége egy újabb kedvezőtlen tulajdonság.

A megjelenő cikkek tudományos cikként vagy olvasói levélként való kategorizálása részben önkényes, és egyes, főleg orvosi lapokban mindennapos gyakorlattá vált, hogy tudományos eredményeket olvasói levélként hozzanak le, esetenként kifejezetten bátorítják a szerzőket, hogy munkájukat ilyen formában nyújtsák be közlésre (Sevinc, 2003). A szokás kialakulásának eredetéről nincs információnk, azonban a megjelenő anyagok átkategorizálása mint lehetőség, minden szerkesztő számára rendelkezésre áll, és így növelhető az IF. Az ilyen manipuláció könnyen leleplezhető és a kategóriák utólagos helyrerakásával, vagy a nem-cikk publikációkra érkező hivatkozások figyelmen kívül hagyásával egy tisztított impakt faktort kaphatunk (Amin, Mabe, 2000).

A „lassú” tudományok számára vonzó csel a kötetek idő előtti megjelentetése. Egy elméleti közgazdaság-tudományi folyóirat esetében előfordult, hogy a kötetek másfél évvel a rajtuk szereplő dátum előtt jelentek meg! Így a hivatkozások megjelenésére nem 1–2, hanem 2,5–3,5 év marad, várhatóan növelve az impakt faktort.

A manipulációk másik esetében maguk a hivatkozások torzulnak: ez egy igen kedvezőtlen fejlemény a hivatkozásanalízis szempontjából, hiszen így éppen az analízis alapjául szolgáló adatok változnak meg; itt a korrekció csak meglehetősen drasztikus és vitatható módszerekkel lehetséges. Az ilyen manipuláció legkézenfekvőbb formája a folyóirat önhivatkozásának bátorítása, rosszabb esetben megkövetelése (Agrawal, 2005; Gowrishankar, Divakar, 1999; Sevinc, 2003; Sharp, 2004). A hírneves Lancet orvosi folyóirat 1997 óta a cikkekhez mellékelt hozzászólásokban hivatkozik az eredeti cikkre; ezzel a technikai változtatással önmagában mintegy 35%-kal megnövelte impakt faktorát (Cameron, 2005; Van Leeuwen és Moed, 2002).

Az impakt faktor ugyanakkor nem elfogult a nagy folyóiratok irányába, bár érdekes módon a sok cikket publikáló folyóiratok impakt faktora konzisztensen nagyobb (Cameron, 2005). Ennek okára nem találtunk vizsgálatokat, de a jelenséget magyarázhatjuk a cikkek között jelentkező externáliákkal. Amikor ugyanis az olvasó rátalál a folyóiratban megjelenő valamely cikkre, egyúttal rátalál az összesre is, és egy nagy folyóiratban esélyes, hogy talál más kapcsolódó cikket is. A gondolatmenet megállja a helyét a klasszikus papíralapú keresés, de különösen az internetes böngészés esetében is.


4.3. Páros összehasonlításon alapuló módszerek

Az IF számos kritikája közül sok valójában technikai és az IF megfelelő csiszolgatásával feloldható. A kapott mérőszámok mégsem generálnak reprodukálható rangsorokat, elsősorban azért, mert az IF erősen függ a vizsgált folyóiratok körétől; egy szinte lényegtelen változtatás is átrendezheti a vezető lapok sorrendjét. Ennek oka, hogy az IF minden lapot egyformán komolyan vesz. Az értékelést alapjaiban változtatja meg, ha a különböző folyóiratokat súlyozva, azaz a különböző folyóiratokban megjelenő hivatkozásokat különböző mértékben vesszük figyelembe: minél értékesebb egy folyóirat, annál nagyobb, minél kevésbé értékes, annál kisebb súllyal. Így ha az értékesebb lapokban megjelent hivatkozásokat már figyelembe vettük, a további lapoknak egyre kisebb a jelentősége. Így a kapott eredmény alig, vagy egyáltalán nem függ az indexelt folyóiratok pontos halmazától.

A páros összehasonlítás módszere (Bradley, Terry, 1952) egy statisztikai módszer, mely eredetileg azt határozza meg, hogy – a folyóiratok rangsorolásánál – mekkora a valószínűsége, hogy egy folyóirat a vizsgált folyóiratra hivatkozik. Stigler, Stigler és Friedland (1995) egyebek mellett ennek egy változatát is használja a közgazdaság-tudományi folyóiratok rangsorolására. Sajnos a módszer csak egymással szoros hivatkozási kapcsolatban levő folyóiratokra alkalmazható (Liner, Amin, 2006), ami már a közgazdasági lapok egészéről sem mondható el. Az alábbiakban több egyszerű módszert is bemutatunk. A páros összehasonlításon alapuló módszerekről részletes áttekintést Csató (2013) ad.

4.3.1. Az LP-módszer

Hogyan súlyozzuk a folyóiratokban megjelenő hivatkozásokat? Ha az önkényes értékeket – helyesen – elvetjük, adja magát, hogy a súlyok maguk a kapott folyóirat-értékelések legyenek. A laikusnak első hallásra talán lehetetlennek tűnő feladat megoldása kétféleképpen is meghatározható. Egyrészt a folyóiratok értékelése egy megfelelően felírt mátrix sajátérték-vektora, azaz egy olyan vektor, amit a mátrixszal megszorozva önmagát kapjuk. Másrészt, ha kezdetben egyformán súlyozzuk a folyóiratokat, a kapott értékelést súlyként használva, majd ezt a lépést kellően sokszor ismételve, határértékben megkapjuk a kívánt értékeket. A módszer először Liebowitz, Palmer (1984) a közgazdaság-tudományi folyóiratokat értékelő munkájában bukkant fel; ma LP-módszerként ismert, ami utalhat a szerzők nevére (különösen, hogy tíz évvel később Laband, Piette (1994) frissítette a rangsort), vagy a társadalmi döntések elmélete és a matematika határterületén megfogalmazott bajnokságok körében ismert, lényegében azonos long path módszerre (Laslier, 1997). Ugyanezt a módszert használta Kalaitzakis, Mamuneas, Theofanis és Stengos (2003) a közgazdaság-tudományi rangsor eddig legutolsó frissítéséhez.

Az alábbiakban formálisan is definiáljuk az LP-módszert.

Jelölje J = {1, ..., n} a folyóiratok halmazát! Bármely két i és j folyóirat esetében cij a j folyóiratban megadott, i folyóiratra vonatkozó hivatkozások számát jelöli.
A C = (cij)i,j Î J hivatkozási mátrix egy n × n-es egészértékű mátrix. Jelölje DC a diagonális n × n-es egészértékű mátrixot, melynek átlóján a cj = å i Î Jcij, értékek helyezkednek el. Itt cj nem más, mint a j folyóirat által adott összes hivatkozás száma. Legyen a egy n dimenziós egészértékű vektor, melynek aj koordinátája éppen a j folyóiratban megjelenő cikkek számát mutatja. Jelölje továbbá A a diagonális n × n-es egészértékű mátrixot, melynek átlóján az aj értékek helyezkednek el. Egy z vektor esetében ||z|| = å ni = 1|zi|.

Az LP módszer egy (J, a, C) értékelési problémának az a v megoldása, melyre teljesül, hogy

A–1Cv

 = v

||A–1Cv||

azaz v az A–1C mátrix pozitív sajátvektora.

Az LP-módszer sok korábbi kritikát megválaszol, azonban a tudományterületek összehasonlítására továbbra sem alkalmas. Könnyen belátható ugyanis, hogy a magas hivatkozási intenzitású tudományterületeken nagyjából arányosan magasabb értékeket kapunk.

4.3.2. Az invariáns módszer és az Eigenfactor

Az invariáns módszer (Moon, Pullman, 1970; Pinski, Narin, 1976) elsődleges célja olyan értékelést adni, ami független a folyóiratok vagy tudományterületek hivatkozási intenzitásától. Míg az LP-módszerben egy folyóirat értéke a rá hivatkozott folyóiratok értékének a hivatkozások számával súlyozott átlaga, az invariáns módszerben a súlyokat leosztjuk a hivatkozó folyóirat hivatkozási intenzitásával, azaz egy folyóiratnak egységnyi „szavazata” van, és ezt osztja szét a hivatkozott lapok között.

A már ismert jelölést használva az invariáns módszer azt a v értékelést adja, melyre teljesül, hogy

A–1 CDC–1 Av = v,

azaz v az A–1 CDC–1 A mátrix pozitív sajátérték-vektora.

Az invariáns módszer látványosan átrendezi a folyóiratok sorrendjét. Például a közgazdaság-tudományon belül a viszonylag keveset hivatkozó elméleti tartalmú folyóiratok látványos előrelépést mutatnak. Az elméleti kutatók ezt természetesen üdvözlik, de egy értékelő módszert sosem az eredmény, hanem a módszer tulajdonságai szerint kell megítélni. Az invariáns módszer érdekessége, hogy Palacios-Huerta, Volij (2002) axiomatikusan karakterizálta, azaz megadott néhány, jelen esetben három olyan, értékelő módszerekre vonatkozó tulajdonságot, melyet egyszerre csak az invariáns módszer teljesít. Azóta több új axiomatikus karakterizáció is megjelent (Altman, Tannenholz, 2005; Slutzki, Volij, 2006; Volij, Palacios-Huerta, 2014).

Az invariáns módszer a vonzó tulajdonságai mellett a gyakorlatban is bizonyított. A Google keresőmotor eredetileg az invariáns módszer egy véletlen elemmel megbolondított változatán alapszik (Brin, Page, 1998). Hasonló modell áll a Bollen, Rodriquez és Van de Sompel (2006) által bevezetett presztízsmutató (PR), illetve az Eigenfactor (EF – West, Bergstrom és Bergstrom, 2010) mögött is.

A sajátérték-alapú értékek mind az olvasó véletlen vándorlását modellezik a folyóiratok hivatkozási hálójában. Az olvasó véletlenszerűen vesz egy cikket, majd véletlenszerűen követi valamelyik, az itt, a vizsgálati ablakban megjelent hivatkozást. A kapott értékelés tulajdonképpen azt mutatja meg, hogy várhatóan mennyi időt tölt az olvasó a különböző folyóiratokkal. Az LP-, és az invariáns módszer, illetve változataik abban térnek csak el, hogy pontosan hogyan történik a véletlen választás, az Eigenfactor is csak annyiban több, hogy apró trükkökkel megtisztítják az adatokat. Így figyelmen kívül hagyják a folyóiratokon belüli hivatkozásokat, ha pedig egy hivatkozott, de nem hivatkozó folyóirathoz jutunk (ún. „dangling nodes”), véletlenszerűen kiválasztunk egy tetszőleges cikket. Bizonyos valószínűséggel a keresés véget ér és új keresést indítunk, ekkor ismét egy véletlen cikket választunk.

Míg az Eigenfactor a folyóirat méretével nagyjából arányos, így egyszerre mutatja a folyóirat minőségét, az Article Influence Score (AIS) (West et al., 2010) megmutatja, hogy a folyóirat EF-pontszáma hányszorosa annak, amit a cikkek száma alapján arányosan várnánk – azaz az átlagosnál hányszor értékesebbek a folyóiratban megjelenő cikkek.

A Google azóta többször módosította az algoritmust, melynek elsődleges oka, hogy a weboldalak üzemeltetői sikerrel manipulálták a hivatkozási adataikat. A manipuláció egy része szervezett: hivatkozó-körök jöttek létre; a portfóliójukban több száz folyóiratot működtető kiadók korában talán nem képtelenség, hogy több folyóirat együttműködve növelje az értékelését, megdöbbentő módon az invariáns módszer által generált, akár egy folyóirat önmagában is manipulálhatja!

Egy hivatkozás nem más, mint annak elismerése, hogy a folyóiratban közölt tudás korábbi eredményeken alapszik. Több hivatkozás értelemszerűen kevesebb hozzáadott tudást jelent. Azt várnánk tehát, hogy ceteris paribus több adott hivatkozás rosszabb értékelést eredményez. Ugyanakkor az invariáns módszer mellett ez nemcsak, hogy nem mindig igaz, de bizonyos esetekben további hivatkozások elhelyezése javíthatja a folyóirat értékelését, így az invariáns módszer manipulálható (Kóczy, Strobel, 2009).

4.3.3. A módosított invariáns módszer/fair-bets módszer

Az invariáns módszer kiváló eljárás a folyóiratokban megjelenő átlagos cikkek felértékelésére. Egy cikk értéke azonban adódhat minőségéből vagy mennyiségéből: ha ugyanis két cikket összeragasztunk, a kapott cikk az eredeti részek összes hivatkozását megkapja, és így egy folyóirat, mely ilyen összeragasztott cikkekből áll, értelemszerűen jobb értékelést kap. Megfordítva: nem mindegy, hogy egy lap hosszú, áttekintő írásokat, vagy rövid közleményeket publikál, utóbbi esetben nyilvánvaló hátránnyal indul a többi folyóirattal szemben. Ha minket kizárólag a szakmai kiválóság érdekel, az értékelésnél oda kell figyelni a cikkek terjedelmére is; az egyazon folyóiraton belül megjelenő, de eltérő terjedelmű cikkek is különböző értékelést érdemelnek. A módosított invariáns módszer (Kóczy, Nichifor, 2013) esetében a cikkekre kapott értékelést elosztjuk a cikkek átlagos hivatkozási számával, s egy adott cikk értéke a folyóirat módosított invariáns értéke szorozva a cikk hivatkozásokban mért hosszával. 

Matematikailag a módosított invariáns módszer nagyon leegyszerűsödik; az a v vektor, ami teljesíti a következő egyenlőséget:

DC–1 Cv = v,

ami egybeesik a hasonló elvek szerint módosított LP-módszerrel, illetve a Daniels (1969) által bevezetett, ma fair-bets módszerrel (González-Díaz, Hendrickx és Lohmann, 2014; Slutzki, Volij, 2006).

4.3.4. Scimago Journal Rank

Módosított invariáns módszernek tekinthető a hivatkozási hálón túl a cikkek számát is figyelembe vevő Scimago Journal Rank is (PSJR – González-Pereira, Guerrero-Bote, Moya-Anegón, 2010).

ahol d és e paraméterek, d = 0,9 és e = 0,0999, DN a hivatkozott,de nem hivatkozó folyóiratok („dang­ling nodes”) és  . Az SJR2 (Guerrero-Bote & Moya-Anegón, 2012) a képletet to­vább finomítja. Bár érdekes ahogy ezek a SCImago kutatócsoport által kidolgozott képletek igyekeznek több szempontot is figyelembe venni a folyóiratok értékelésénél, meglehetősen önkényesnek tűnnek.

4.3.5. A bajnoksági módszer

Visszatérő kritikája a különböző értékelési módszereknek, hogy a területek különböző hivatkozási szokásai miatt a folyóiratok értékelése nem összehasonlítható. Ennek megfelelően a módszerek leggyakoribb alkalmazása az egyes tudományterületekhez tartozó folyóiratok rangsorolása. Az ilyen rangsorok rendkívül hátrányosan kezelik az interdiszciplináris területeket, hiszen hatásuknak csak egy szeletét veszik figyelembe (Bardhan, 2003). A bajnoksági módszernek (Kóczy, Strobel, 2010) éppen az a lényege, hogy minden egyes folyóirat számára létrehozunk egy saját tudományterületet a folyóirattal hivatkozási viszonyban levő lapokból. A hivatkozási viszonyban levő folyóirat-párokat páronként összehasonlítjuk, és egy „mérkőzést” játszanak: az a nyertes, akire a másik fél többet hivatkozik. Egy folyóirat pontszáma a győzelmi aránya, ahol a döntetlenekért fél pont jár.

Az egyszerűségén túl a módszer érdekessége, hogy nem manipulálható, nem érzékeny a folyóiratok méretére, sem a hivatkozási szokásokra. Mivel a vizsgálatban a megjelent cikkek száma nem szerepel, teljesen mindegy, hogy a kapott és adott hivatkozások milyen terjedelmű vagy műfajú írások között oszlanak meg. További előnye, hogy mivel csak lokális adatokat igényel, bármely folyóirat „bajnoksági pontszáma” (pontosabban annak egy alsó becslése) kiszámítható minimális erőfeszítéssel.

A módszer nem súlyozza a mérkőzéseket sem a „gólaránnyal” sem az ellenfél teljesítményével, és ezzel a vizsgált adatbázis is befolyásolja az eredményeket. Kézenfekvő volna a már ismertetett súlyozási módszerek receptjét követve az értékeket mint súlyokat venni, s végeredményben a bajnoksági mátrix sajátérték-vektorát használni. Sajnos ezzel a trükkel az egyszerűség mellett sok kedvező tulajdonság is elvész. Az elméleti motiváció sem teljesen világos, hiszen az érthető, ha egy lapnak nagy siker egy sokkal nívósabb lapot „megverni”, azonban egy nívós folyóirattól elszenvedett vereség érthető, természetes, nincs nagy jelentősége (l. még Csató, 2013, 2014 hasonló érvelését).


4.4. Egyéb módszerek

Végül említést teszünk két további módszerről, melyek a folyóiratok értékelésének lehetséges új irányait adják.

4.4.1. A h-index és társai

Egy kutató h-indexe (Hirsch index) az a legnagyobb egész szám, amire a kutató legalább h darab, egyenként legalább h alkalommal hivatkozott cikket publikált (Bencze, 2006; Hirsch, 2004). A h-index egy számértékbe sűríti a kutató munkájának két aspektusát: a termékenységet és a szerzett cikkek hatását. A hivatkozások száma lehet magas 1-2 sikeres cikk miatt is, amibe a vizsgált szerző esetleg csak „véletlenül” került bele társszerzőként. Más grafomán szerzők hatás nélkül ontják magukból a cikkeket. Egyik említett szerzőnek sem lenne magas a h-indexe, ehhez tartósan magas szintű kutatást kell felmutatni.

A h-indexet hamar axiomatizálták (Woeginger, 2008a, 2008b), általánosították folyóiratokra is (Braun, Glänzel és Schubert, 2005, 2006) és ma már számtalan változata ismert (Alonso, Cabrerizo, Herrera-Viedma és Herrera, 2009; Moussa, Touzani, 2010; van Eck, Waltmann, 2008). Ilyen a ch-index, mely az önhivatkozásokat figyelmen kívül hagyja; a h(2)-index, mely darabonként h(2)2 hivatkozást vár el (Kosmulski, 2006); a g-index, ami a g összesen legalább g2 hivatkozást kapott cikket feltételez (Egghe, 2006); az A-index, mely a legalább h hivatkozást elért h cikk átlagos hivatkozás-száma; az R-index a legalább h hivatkozást elért h cikk hivatkozás-számának négyzetgyöke; míg az AR-index a legalább h hivatkozást elért h cikk megjelenése óta évente átlagosan kapott hivatkozások összegének négyzetgyöke (Jin, Liang, Rousseau és Egghe, 2007); Bornmann, Mutz és Daniel, (2008) összesen kilenc variánst hasonlítanak össze, Chambers és Miller (2014) pedig az ilyen mértékek egész osztályát definiálta és vizsgálta.

A lelkesedés elsősorban az index egyszerűségének és a teljesen új megközelítésnek szól, holott a h-index sem mentes a hibáktól. Az index (legyen szó kutatókról vagy folyóiratokról) függ a vizsgált adatbázistól (Bar-Ilan, 2008) és természetesen a tudományterülettől: annak méretétől, hivatkozási intenzitásától. Egy genetikával és egy játékelmélettel foglalkozó folyóirat h-indexe nagyon különböző lesz, hiába közölnek egyformán sikeres cikkeket. Végül a kutatók esetében a megjelent cikkek száma aligha manipulálható, ezzel szemben egy folyóirat bármikor dönthet több cikk elfogadása mellett, amivel – gyengén – nő a h-indexe. Egy nagyobb terjedelmű folyóiratnak ceteris paribus gyengén nagyobb lesz a h-indexe; ugyanez a szerzői munkásságokra is vonatkozik, de ott aligha kifogásolható. Összességében tehát a h-index és variánsai alig jobbak az impakt faktornál.

4.4.2. Burkolófelület-elemzés (Data Envelopment Analysis, DEA)

A burkolófelület-elemzés egy lineáris programozási eljárás, ahol valamilyen célfüggvényt a bemenetek ismeretében, de a bemenet-kimenet közötti összefüggés ismerete nélkül kívánjuk optimálni. A folyóiratok értékelése esetében a bemenetet a folyóirat bizonyos jellemzői (hivatkozások száma, önhivatkozások száma vagy IF) jelentik (Burton, Phimister, 1995). Valójában tehát ez a módszer meglevő hivatkozásanalitikus módszerek, illetve hivatkozásoktól teljesen független jellemzők segítségével alkot minőségi modellt.

Ez a fajta modellalapú megközelítés érdekes, de emellett számtalan olyan rangsorolási javaslat született, melyek a már ismertetett módszerek közül egyet vagy többet felhasználva, összekombinálva alkot a szerzők szerint elfogadhatóbb rangsort. Hogy stílusosan fogalmazzunk, ezek a módszerek egyelőre különösebb hatás nélkül maradtak, egyiket sem érezzük olyan jelentőségűnek, hogy egy kritikus hivatkozást tegyünk rájuk.

1. táblázat A folyóiratok értékelésének különböző módszerei és tulajdonságaik


5. ÖSSZEFOGLALÁS

Tucatnyi módszert mutattunk be a folyóiratok minőségi értékelésére; az 1. táblázatban áttekintjük a fontosabbak tulajdonságait. A bevezetőben utaltunk rá, hogy a folyóiratok értékelését több okból is elvégezhetjük.

A táblázatban „cikk”, vagy „cikk egység” értéket jelző mutatók alkalmasak a kutatói teljesítmény értékelésére. Az előbbieknél a publikációk értéke a vonatkozó évre kiszámított mutató. Melyik módszer használható, vagy használandó? Egy jó módszer évente szabadon hozzáférhető értékelést ad, és sem a terjedelemre, sem a hivatkozási intenzitásra – sem más, a folyóirat értékétől független jellemzőre sem – érzékeny és nem manipulálható. Sajnos ilyen módszer nincs. A manipulálásnak ugyanakkor vannak fokozatai, és az invariáns módszerek esetében felmerülő lehetőség sokkal bonyolultabb, mint más módszereknél, így aligha valószínű, hogy a szerkesztők vagy kiadók ehhez a módszerhez nyúlnának. Így tehát az eigenfactor.com-on elérhető Article Influence Score mutató a legérdekesebb.

A módosított invariáns módszer ennél árnyaltabb értékelésre is lehetőséget ad, hiszen itt figyelembe vehető a folyóiratban megjelenő cikk terjedelme is; itt a cikk értéke a módosított invariáns érték, szorozva a cikkben szereplő hivatkozások számával. Bár az Article Influence Score és a Thomson Reuters által publikált leíró statisztikák alapján egy ehhez hasonló „módosított Article Influence Score” könnyen kiszámítható; sajnos ez nem áll készen rendelkezésre.

A táblázatban a „folyóirat” értékét mérő jellemzők segítenek a könyvtárosoknak – ezeknél a módszereknél a folyóirat összértékét mérjük, ahol egyszerre nézzük a mennyiség és a minőség hatását. Ezt az értéket kell összevetni az előfizetési díjjal. A Bergstrom és McAffe által fenntartott www.journalprices.com egy adatbázis, ahol (szinte) minden folyóiratra megkereshetjük a folyóirat költséghatékonysági mértékét. A CE (cost effectiveness) mutató a normalizált árak és az (eleve normalizált) Eigenfactor-mértékek hányadosa: az 1-es CE értékkel rendelkező lap átlagos, a nagyobb CE értékű rosszabb, az alacsonyabb CE értékű jobb költséghatékonyságú.

Footnotes

  1. ^ A Thomson Reuters cég Journal Citation Reports (JCR) című, évente megjelenő kiadványa a tudományos folyóiratok értékelését tartalmazza. A kiadvány alapja a tudományos publikációkat, elsősorban folyóiratcikkeket feldolgozó Web of Science szolgáltatás. A JCR hivatalos weboldala: http://thomsonreuters.com/en/products-services/scholarly-scientific-rese...
  2. ^ Az indexelés során a közleményekről olyan adatokat (metaadatok) vesznek fel, amelyek biztosítják, hogy azok visszakereshetőek, különböző szempontok szerinti csoportosíthatóak legyenek.