Olvasási idő: 
39 perc

A régi és új történeti adatok társadalmi természete

Elég nagy biztonsággal kijelenthető, hogy nincs olyan történelmi, történetszociológiai téma, ami objektíve ki lenne merítve, azaz amiről kizárható lenne, hogy valamikor a jövőben

 • régi adatok új szempontból történő, új módszerrel készülő újraelemzése alapján,
 • régi adatokból újjáalkotott metaadatok alapján, 
 • új adatok alapján,
 • régi és újabb adatok összevetése alapján,
 • más hasonló témákról szóló elemzésekkel való összevetés alapján, vagy akár
 • egyetlen elemzés belső érvrendszerének, adatközléseinek újragondolása alapján újabb elemzés ne lenne írható.[1]

Ha egy kvalitatív kutató vagy hermeneuta idáig eljut – azt további olvasásra biztatom: ugyanis a cikkben az „adat” nemcsak a kvantitatív vagy statisztikai alapú tanulmányok forrásául szolgáló ismeretet, hanem bármely tudományos mű forrását jelenti majd.

E cikkben minden egyes altémán belül először arra szeretnék kitérni, hogy az „adatok új világa” (mely valószínűleg a számítástechnikával, s különösen az internettel vette kezdetét) hogyan alakítja át – funkcionalistán szólva – a tudományos témákat és módszereket, majd arra, hogy – konfliktusos paradigmában fogalmazva – a tudományos közösségek milyen érdekviszonyok alapján kezelik, illetve ismerik el egyáltalán releváns adatnak az új információs helyzet „termékeit.”

Három – kétségtelenül eltérő méretű – altémát szeretnénk kifejteni ezen a módon: a régi típusú, de új adatok keletkezését; az új típusú új adatok keletkezését; régi adatok újrahasznosulását.  Ez a tanulmány csak a „régi dolgokról” szóló adatok új kontextusaival foglalkozik, nem tér ki arra, hogy napjaink jelenségeiről töméntelen mennyiségű új adat keletkezik, melyek egyrészt befolyásolják a régebbi dolgok, párhuzamos trendek  „kifutásáról” való tudásunkat, ezért a napjainkról szóló adatok robbanásszerű bővülése a közelmúlt történetének folyamatos átírására késztet – másrészt a „gyorsuló időben” maguk is hamar történeti forrássá válnak. Nyugodtan feltételezhetjük, hogy amiképpen az első adatrobbanás korának történészei és levéltárosai nem látták át mindazokat a módszereket, ahogyan koruk adattömegét – pl. a frissen megszületett napisajtót, az alfabetizmus általánossá válása következtében nagyságrendekkel megnövekedett magánlevelezést, a városias ügyintézés, üzemszerű termelés exponenciálisan megnőtt írásbeliségét –  a jövő tudósai használni fogják, (vagy használhatnák, ha megőrizték volna…) úgy valószínűleg ma sem látjuk pontosan, hogy spontán keletkező digitális adattömeg hogyan hasznosul majd a jövőben, illetve, hogy az „evidence based” döntéshozás korában – az egymással konkurráló álláspontok alátámasztására felépített strukturált, „tudományos” adattömegrész mennyire éli túl az alátámasztandó álláspont kisebbségben maradását.  

Ha a terjedelem engedné, a „jövő történészeire gondolva” logikailag két – hipotetikus – fejezetet lehetne csatolni: az új dolgokról szóló új, de strukturálatlan adatok keletkezésének társadalmi természetét, végül a strukturált, illetve „tudományos” adat születését és visszatöltődését az adatok körforgásába.


Régi típusú, de új adatok keletkezése

Vannak olyan témák, ahol a szorosan vett kérdésre vonatkozóan „nem kerülnek elő” újabb adatok. Sok évtized óta nincs például újabb adat a római történelem királyságkori szakaszának politikatörténetével kapcsolatban, s nem kerülnek már elő újabb Arisztotelész szövegek sem. A „nincsenek már újabb források” mint diagnózis, a tudományos közösségben jóval megelőzi az adatrobbanás korát, így példáink jó része lesz kissé régebbi.

Először is szögezzük le: nem zárható ki, hogy előkerülhetnek – például újabb autópálya-építések során – újabb adatok ilyen régi dolgokról is. Az újabb autópálya-építések, sőt a kunyhók és bádogvárosok helyére épülő, jelentősebb alapozást igénylő építkezések – Kelet Európában, Ázsiában és Afrikában – természetesen nem elsősorban a helyi gazdasági és politikai elitek ambícióin múlnak, így az ezzel kapcsolatos szabályozás sem egyszerűen a helyi maffia-elitek és gyenge tudományos elitek erőviszonyának kérdése,[2] hanem a nemzetközi tudományos közösség „dolga és felelőssége” is. Az „új adatok előkerülése” – pontosabban annak valószínűsége – bármely ókori, őskori, középkori témában annak a kérdése is, hogy a nemzetközi tudományos közösség belső erőviszonyai – az egyes témák „fontossága,” az irántuk való „érdeklődés” mértéke – mely témák esetében teszik lehetővé, hogy a közösség a szükségképpen korlátos lobbizási kapacitását arra fordítsa, hogy az építkezési projekt nagy nemzetközi finanszírozóin keresztül – finanszírozási feltétellé téve – rászorítsa a helyi kormányzatokat a régészeti munkálatok elvégzésére. Más esetekben maga a nemzetközi tudományos közösség mozgósítja az erőforrásait, hogy valamely építkezés következtében a régészet elől végképp elzáródó területek „soron kívül” feltárásra kerüljenek. (E folyamatok gyakran rejtve zajlanak, vagy épp csak elmaradásukat konstatálhatjuk, de vannak a tudományt kedvelők számára pozitív példák is. Ilyen például az asszuáni gát építése körül megvalósult gigantikus régészeti projekt.[3])

A forrásokat, illetve potenciális forrásokat tudatosan pusztító külföldi folyamatokba való beavatkozást természetesen korlátozza, hogy a nemzetközi tudományos közösség szervezetei – mint ezt számos példa igazolja – általában az alacsony intenzitású (magyarán pacifista, mondhatnánk „defetista”) amerikai és európai külpolitikai vonalvezetés hívei.[4] Jelentős nemzetközi gazdasági, ill. katonai konfliktus vállalása nélkül pedig nyilvánvalóan nem lehet(ett) megvédeni a kínai kulturális forradalom áldozatául eső kincseket,[5] a tálibok által elpusztított buddhista örökséget,[6] vagy az ISIS csapatok útjába eső ókor-történeti szempontból egyedülálló rom-városokat,[7] régészeti lelőhelyeket.

Igazi új adatok előkerülése azért sem kizárható, mert periférikus (vagy éppen autokratikus hatalmak által ellenőrzött) levéltárak, közgyűjtemények, magángyűjtemények időről időre hozzáférhetővé tesznek olyan korábban előkerült forrásokat, melyeknek néha létezéséről sem tudunk.

A modern történelem fordulatait megvilágító adatok titkosság alóli feloldása könnyen átlátható csatározások, vagy szabályozások tárgya. Ez előállhat diktatórikus rendszerek bomlásakor és demokratikus viszonyok között is. Előbbire példa a magyar-szovjet kapcsolatok történetét jelentősen módosító Jelcin dosszié megjelenése,[8] utóbbira a második világháború hadtörténetét új megvilágításba helyező Enigma[9] -story, vagy a németországi Fischer-vita alapjául szolgáló egyetlen dokumentum[10] megtalálása. A szimbolikus politizálásra nagyobb gondot fordító hatalmak szemében évezredes iratok vagy leletek is jelentőséggel bírnak – gondoljunk csak a Holt-tengeri tekercsek Vatikánba került részeinek hosszú titkosságára,[11] vagy arra, hogy azok a régészeti adatok, amelyek az orosz állam megalapozásában betöltött viking szerepről szóltak, hosszú ideig államtitkot képeztek a Szovjetunióban.

Az pedig gyakorlatilag bizonyos, hogy adott történeti témával egyidejűleg történő események meglévő vagy újonnan felfedezett relációi előkerülnek. Azaz újabb adatok valamiféle, másutt egyidejűleg vagy kissé korábban zajló eseményről, amelyek a világban zajló események teljes komplexitását feltételezve valamiképpen kihathattak a vizsgált dolog lefolyására, vagy olyan későbbi jelenségekről szóló információk, melyek valamiképpen a vizsgált esemény hatását tükrözik. Itt nem arról az elméleti tézisről van szó, hogy minden mindennel összefügg, hanem arról, hogy a kutatás természete a szélesebb összefüggések keresése. A 16-17. század magyarországi bibliográfiájában például jól látszik, hogy régebben a kuruc-labanc, török-Habsburg erőviszonyok alakulásáról szólt elsősorban a szakirodalom. Ezt egészíti ki, váltja fel fokozatosan a török birodalom közép-keleti, illetve a Habsburg birodalom összeurópai, sőt latin-amerikai helyzetének elemzése, mint olyan tényezőké, melyek a végvári vitézségnél talán jobban hatottak a magyar történelemre. De a „kutatás természetén” kívül nyilvánvalóan célszerű megemlíteni, hogy a kutatók növekvő száma, a közelebbi források feltártsága a történésztársadalmon belül prezstízsnövekedésre vágyó kutatókat szociológiai értelemben is a tágabb összefüggések kutatása, távolabbi adatok beemelésének irányába nyomja.

Külön kérdés, hogy bármely kutatási tárgyul választott konkrét folyamat elemzésénél, megértésénél, megvilágításánál segít az analóg folyamatok elemzése, tehát bármely másik hasonló folyamattal kapcsolatban előkerülő újabb adat segíthet a vele térbeli, időbeli vagy oksági kapcsolatban nem lévő célba vett folyamat bemutatásánál. (Az időnként „interkulturálisnak” nevezett érvelésre a legújabb példa, hogy az Észak-Amerika történet szempontjából tényleg fontos Cahokia-projekt mellett azzal érveltek Illinois-i régészek, hogy eredményeiből más – közel keleti –  ókori városok fejlődését lehet majd megérteni...)Nyilvánvaló, hogy az analógiás megközelítés és az adatbővülés kapcsolata sajátos dinamizmust hordoz. A kevés adat alapján analógnak látott – a kutató által egyetlen kategóriába sorolható – folyamatok megértését egy ideig segíti az adatbővülés. Ha viszont a kategóriába tartozó folyamatok egyikéről vagy másikáról váratlanul és esetlegesen nagyon sok adathoz jutunk, akkor felmerül a kérdés, hogy milyen mértékben extrapolálhatók az egyedi tulajdonságok a kategóriába sorolható többi folyamatra.

A kutatásról és tudományos elemzésről szóló fenti mondatok – nyelvi korlátainknál fogva – azt sugallják, mintha „az oksági kapcsolatok felállítása” vagy az „analógiák használata,” illetve ezek mértéke funkcionalista módon elhelyezhető lenne egy helyes-helytelen tengelyen, legalábbis módszertani értelemben. Csakhogy ez közel sincs így. A tudományos termelés természete[12] kétféle értelemben is relativizálja az egy-egy téma kapcsán egy konkrét időpontban „megengedhető” oksági kapcsolatok vagy analógiák mértékét.

Az egyik szempont a tudomány makrotársadalmi integrációjával kapcsolatos. A nemzeti elitek szimbolikus versengése pl. nemzeti ősmítoszok teremtésére ösztönözte (még az 1980- as években is!) a valláskutatókat.[13] A nacionalizmus korában kuruc dalokat fedeztek fel a történészek, s hogy nehogy kiderüljön, hogy gyengébbek, mint a „labanc” nyugati zene értékei, még hamisítottak is ilyeneket. Thaly Kálmán professzor idevágó történetének a tanulsága[14] nem egyszerűen alkotáslélektani: a lelepleződést követő széleskörű értelmiségi diskurzus mutatja, mekkora lehet a nyomás és milyen erős a mentség a tudományos etikát nyilvánvalóan sértő adatmanipulációra. Az a speciális körülmény, hogy az 1900-as évek iparának különös mértékű pétervári és moszkvai koncentrációja létrehozott egy erős ipari munkásságot és munkásmozgalmat, lehetővé tette azt a – minden jel szerint „téves” – tudományos elméletet, hogy más gyengén iparosodott országokban is lehetséges munkásmozgalom-történeti jelenségként magyarázni az országos folyamatokat – olyan kategóriákkal, melyeket a 19-20. századi német, angol társadalomra dolgozott ki a történetírás. A munkásmozgalom-történetírás így vált[15] az egykori szocialista blokk egyik fontos közös tudományos projektjévé, erőforrásokat elvonva a bolgár, román vagy éppen albán történetírás talán relevánsabb kérdéseitől. (Csak az olvasó szórakoztatása céljából érdemes felidézni, hogy Werbőczy tettei között a köznemesi megyei hatalmat valóban évszázadokra meghatározó jogtudósi szerep és a második jobbágyság kialakulásában valóban fontos politikai-közigazgatási szerepkör mellett, mint azokkal egyenrangú tettet idézték fel történelemkönyveink egy korabeli (tehát 16. századi!) bányászmozgalom letörését, hogy így Werbőczy a munkás-paraszt összefogás elleni úri-világ előképévé válhasson.[16] E kétségtelenül mulatságos gondolatmenet komoly kutatói kapacitásokat is megmozgatott, melyek külföldi – mármint csehszlovákiai – levéltári kutatásokat tettek lehetővé. Így e történet már nem öncélúan kerül a „hogyan keletkezik az új adat” tárgyú alfejezetünkbe...)

A történelmi festészet és szobrászat, a könyvkiadás és a filmgyártás, sőt a turizmus értelmiségi és üzleti érdekkörei egészen konkrét nyomást fejtenek ki a kutatókra, hogy a szigorú történeti vagy régészeti kritika által csak nagyon töredékesen igazolt képeket a fantázia szabadabb használatával egészítsék ki. Az ősmagyarok ruháiból és használati tárgyaiból – ha múzeumban járva csak a saját szemünknek hiszünk –  alig ismerünk valamit. Nemcsak a tudományos legitimációval semmiképpen nem rendelkező (de kiemelt kultúrpolitikai támogatást élvező) 1896-os Feszty körkép, de a régészprofesszor László Gyula 1980 körüli (!) rajzai is, meghökkentő „pontossággal” „ábrázolják” „őket.”[17] (Ha az olvasó belegondol, az hogy a három szót külön-külön tesszük idézőjelbe világosan tükrözi: mi minden kérdőjelezhető meg egy efféle rajzban...) Aki Kréta hegyes útjain átvergődik, a déli parton feltárt Phestos-i palota bokáig érő romjaiból láthatja, mi az amiben intellektuális igényességgel „biztosak lehetünk,” azután visszamenekülhet az Evans által – gazdag képzelettel – újjáépített északi Knosszosz-i palotába,[18] mely eleget tesz élményigényeinek, s ahol borsos díjjal növelheti a görög államkincstár bevételeit, reménykedve, hogy nemcsak a turisztikai ágazatot, hanem a görög tudományt is segíti befizetésével.

Nemzedékek szereztek vizuális képet a „római kocsiversenyről” a Ben Hurból, s a tudomány népszerűsítést célul kitűző – és erre például brit közpénzt is igénybe vevő – tévécsatornák is játékfilmrészletekkel növelik annak valószínűségét, hogy a néző őket válassza, s ne a teljesen fiktív helyszíneken, fiktív időben játszódó fantasy-filmet a másik csatornán.[19]

A másik szempont a tudományos termelés természete. A kutatók növekvő száma, a kutatók közötti versengés a totálisan megbízható, de „teljesen érdektelen részletekbe” merülés Szküllája és a mindenképpen újat és „nagyot” mondás Kharübdisze között mozgatja a kutatókat,[20] s számtalan egyéni körülmény mellett az egyetemek vagy a tudomány-finanszírozás intézményes viszonyai határozzák meg, hogy mikor melyik stratégia bizonyul sikeresebbnek. Ráadásul a pillanatnyi siker a tudományban sem azonos mindig a „történelmi távú,” azaz tudománytörténeti kézikönyvek által visszaigazolt, s a kutatók Nyugat Európában látványosan növekvő élettartama[21] miatt egyre inkább még személyesen is megtapasztalható sikerrel.


Új típusú új adatok keletkezése

A hagyományos szöveges vagy tárgyi-képi források mellett a történettudomány olyan új típusú adatokkal is dolgozik, mint az éghajlattörténet,[22] vagy népek keveredését leírni képes genetikai vizsgálatok,[23] évezredes testmaradványok MRI vizsgálata stb., melyek unalomig ismert gazdaság vagy társadalomtörténeti források, sőt egyéni történetek újraértelmezésének nyitnak utat. A folyamatosan fejlődő számítógépes nyelvészeti módszerek[24] látszólag jól ismert forrásszövegek újabb és újabb rétegeit nyithatják meg, folyamatosan fejlődnek a képelemzés módszerei, s azok a növénytani, ásványtani, ill. metallurgiai technológiák is, amelyek évszázadok óta múzeumokban porosodó tárgyak fizikai és kémiai tulajdonságai alapján rekonstruálhatnak évezredes kereskedelmi útvonalakat, illetve bizonyíthatják olyan technikai tudások létezését, melyről nincsen sem szöveges forrás sem képi ábrázolás. A neurológia adatokat termel a nyelvészet, az etológia az őstörténeti kutatások számára.[25]

Mindez – ha a lelkes hangból tudományszociológiai elemzőbe váltunk át – nem kevesebbet jelent, minthogy a hagyományos humántudományi források bázisán kanonizálódott állításokat, paradigmákat új kihívások érik, s az ezekkel kapcsolatos viták kifejezik (ill. ha tárgyilag nem is értjük pontosan miről folyik a vita: számunkra tükrözik) az egyes tudóscsoportok küzdelmét. A tudományos tudástermelés két korábban említett társadalmi összefüggését – azaz a makrotársadalmi tudás-fogyasztást és az azonos területen működő kutatók egymás közötti versengését – kiegészíthetjük egy harmadikkal: a humántudományi kutatók szövetséges-kereső aktivitásával. A 20-21. század befolyásos természettudományai és élettudományai, sőt műszaki tudományai is részt vesznek a humántudósok közötti vitákban és küzdelmekben.

Ez a jelenség az egyik fő oka annak, hogy sosincs és sosem lesz olyan állapot, hogy „nincs újabb adat,” de sosem lesz olyan állapot sem, melyben a különböző érdekű kutatók megegyeznének abban, hogy az újabb adatok relevánsak-e a kérdésről szóló eddigi munkálatok megkérdőjelezéséhez, újraírásához.


Régi adatok újrahasznosulása

Mindazok a történelmi, szociológiai, demográfiai, közgazdasági, irodalomtudományi, művészettörténeti stb. témák, melyek (Európában) az elmúlt nyolcszáz (!) évre koncentrálnak, s különösen azok, amelyek az alfabetizmus széles körű elterjedése, s főként a napisajtó megjelenése utáni évszázadokra fókuszálnak, folyamatosan növekvő adattömeggel néznek szembe.

Ennek a növekedésnek az egyik eleme a preszcientikus és pozitivista korszakban kiadott óriási tömegű eredeti forrás és adatalapú kézikönyv digitalizálása, ami nem egyszerűen a gyorsabb – és a forrásművek eredeti szerkezetétől független – keresést tette lehetővé, hanem olyan összefüggések feltárulását – metaadattá válását – is, amelyek az eredeti mű szerkesztőinek fejében sem lehettek meg. Nyilvánvaló például, hogy több tízezer koraközépkori magyar, német, cseh, francia területeken született egyaránt latin nyelvű oklevél szófordulatait a szövegkiadások tudós szerzői nem hasonlíthatták szisztematikusan össze még egyetlen kézikönyvön belül sem, nem beszélve a különböző országokban kiadott források áttekinthetetlenségéről. Furcsa mód tehát a középkori európai latin nyelvű adattömeg az eredeti – zömmel 19. századi – kiadások bázisán nemzetileg széttagolt adattömegként jelenik meg, míg a digitalizáció után megkezdődhet az „eredeti,” azaz a nemzetállami határoktól független kultúra kutatása.

De a nemzeti nyelvű, írott kézikönyvekre is igaz, hogy a digitalizálás olyan metaadatokat teremt, amelyek sem a szerkesztők, sem a szerzők számára nem álltak rendelkezésre. Például a világ tudományosságában számon tartott egyik leghosszabb terjedelmű kézikönyv, amit egyetlen ember (Szinnyei József) írt a Magyar Írók Élete és Munkái 14 vaskos kötete,[26] illetve annak még terjedelmesebb, de torzóban maradt folytatása – mely Gulyás Pál nevéhez fűződik. E könyvek szerzői – akik céduláikat természetesen a nevek betűrendjében tárolták – sem lehettek tisztában például az egyes magyarországi települések nevének könyvükben való előfordulásával, vagy egyes szavak és fogalmak felbukkanásával az idézett könyvcímekben. A digitalizálás elemi formája mely szabadszavas keresést tesz lehetővé adatok millióit „teremti meg” e kézikönyvekből, s minimális adatbázisba szervezés, mely például a címszavakat, dokumentumokat egymástól elhatárolja, vagy akár elhatárolás nélkül az egymáshoz fizikailag közeli találatokat tekinti összetartozónak már kombinatív kereséseket tesz lehetővé.

A szöveges „adatbázisok” – alapvető forrásként szolgálnak a gyakoriságokat és számszerű összefüggéseket kutató kvantitatív és az egyetlen életpálya vagy jelenség potenciális kapcsolatait felgöngyölítő, egyidejűségeket, párhuzamosságokat mérlegelő klasszikus kvalitatív elemző számára is.

Az adatrobbanás másik eleme, hogy a korábban önmagukban csekély érdekességűnek minősített s ezért kiadatlanul maradt (bár elméletileg ismert) források fokozatosan hozzáférhetővé válnak. Azokban az országokban (pl. Angliában), ahol a történelem során keletkezett magániratok, helyi közigazgatási iratok nem semmisültek meg, a történelmi forráskiadást bőségesen dotáló 19. században is reménytelennek látszott a több millió oldalt kitevő kéziratos irattömeg papíralapú megjelenése. Így a késő-középkori kora-újkori forrásokat kutatók fő tevékenysége a 19-20. században a helyi források feldolgozása, ismertetése és nem publikálása volt. Az internet megjelenése óta azonban valóságos társadalmi mozgalommá vált a kéziratos források átírása, gépre vitele.[27] Ezek a kéziratos források elméletileg évszázadok óta rendelkezésre állnak, tömegesen használható adat mégiscsak a szabadszavas kereshetőség, illetve adatbázisba-szerveződés révén válik belőlük.

Az adatok exponenciális növekedésének harmadik eleme a nyomtatott források tömeges digitalizálása. Ezeknek a forrásoknak a fennmaradása – az iratok fennmaradásának esetlegességével szemben – az európai kultúrkörben az egyes korszakok és területek háborús veszteségeitől többé-kevésbé független. A napilapok, hetilapok folyóiratok, tömeges fogyasztásra szánt kalendáriumok és könyvek digitalizálása egy-egy írni-olvasni tudó emberre évtizedek alatt rázúduló információtömegben való gyors tájékozódást, egyedi esemény-hatás feltárást és szisztematikus tömeges elemzést egyaránt lehetővé tesz.

Míg az előző pontban jelzett példák – az éghajlattörténet vagy a metallurgiai vizsgálódások adatai – teljesen más típusú adatokkal egészítik ki meglévő (szöveges vagy tárgyi kultúrára épülő) ismereteinket, s teszik ezzel újraírhatóvá korábban kimerítően megírtnak gondolt témáinkat, az e pontban ismertetett adatnövekedés a régi típusú (levéltári, könyvészeti) adatok újfajta hozzáférhetőségén keresztül fejti ki a hatását.

Ez az adatnövekedés a korábbi korok adatpublikációihoz képest elképesztő nagyságrendű, de két szempontból mégiscsak a korábbi adatkiadás-adatpublikálás örököse.

Az egyik, hogy csak kulturális és tudományos célból keletkezik, tehát a „társadalmi idő” legnagyobb részét uraló gazdasági tevékenység, közigazgatási-közszolgálati tevékenység és magánéleti tevékenység nem termel ilyen jellegű adatokat. A levéltárak részei ugyan a közigazgatásnak, de e tevékenységük mégis inkább a tudományos alrendszerhez köti őket. Nagy profitorientált cégek foglalkoznak régi folyóiratok vagy könyvek digitális kiadásával, de e cégek termékei iránti keresletet mégiscsak a tudományos kulturális alrendszerben kialkudott közpénzek, illetve az értelmiség kulturális és tudományos fogyasztása biztosítja. Sok ember hobbija (vagy másképpen fogalmazva: szimbolikus tőkefelhalmozása) a digitalizálás, de az ő összesített időfelhasználásuk eltörpül pl. a chateléssel, vagy filmnézéssel töltött össztársadalmi időhöz képest... [28]

A másik, a korábbi adatpublikációhoz hasonlóvá tévő tulajdonsága ennek az új adatvilágnak, hogy ez az adattömeg a némiképp történeti természetű kutatásokat támogatja. Nem a történettudományt érintő hatásról beszélünk, hiszen a jogtörténet a jogtudomány része, az irodalomtörténet az irodalomtudományé, a sajtótörténet a médiatudományé, a politikatörténet a politológiáé, a filozófiatörténet a filozófiáé, a gazdaságtörténet a közgazdaságtudományé stb. De lehetetlen észre nem vennünk, hogy ez a fajta adatnövekedés szisztematikusan kevésbé módosítja a nem történeti természetű vizsgálódások eredményeit, s ekképpen tudományos erőviszonyait.

Ugyanis minél közelebb érünk a mához, annál inkább vannak olyan szerzői, könyvkiadói vagy kereskedelmi érdekek, melyek a nyomtatott művek digitális újrakiadását akadályozzák. Minél közelebb érünk a mához, annál inkább tiltja az adatvédelem, hogy egyedi ügyeket 100 évvel ezelőtti közigazgatási vagy bírósági iratok mintájára nyilvánosságra hozzunk. Minél inkább aktív egy személy, vagy működő egy vállalat és közintézmény, annál erősebb érdekek szabályozzák, hogy mi kerülhet irattermelésükből, vagy audiovizuális dokumentációjukból az internet nyilvánossága elé.

Azaz, míg a kulturális és tudományos célú tömeges digitalizálás a múltra vonatkozó adatok tömeges újrahasznosítását kifejezetten lehetővé teszi, addig a kortárs szempontú elemzéseket torzíthatja. (Ha például a mai amerikai és angol krimi-irodalom szóhasználatát akarná valaki összehasonlítani az interneten full textben elérhető szövegek alapján, könnyen eshetne abba a hibába, hogy a legnagyobb példányszámban megjelenő és ebben az értelemben legjelentősebb művek helyett épp azokból a periférikus művekből vonna le következtetéseket, melyre olyan kicsi a kereslet, hogy szerzőjük szemében a mindenkinek ingyenesen hozzáférhető digitális kiadás reklámértéke és presztízse felülmúlja a ténylegesen eladott könyvek után remélhető hasznot...)

Az elméletileg korábban is létező tudományos adatokhoz való újfajta hozzáférés többféle szempontból is átrendezi a tudományos erőviszonyokat.

Leértékel olyan tőkefajtákat, melyek főképp az idősebb nemzedék rendelkezésére állnak.  Például, ha valaki többet olvasott és jó volt a memóriája, fel tudta hívni ifjabb kollégája vagy tanítványa figyelmét egy, az ő témáját érintő, másról szóló könyvekben, iratokban megbúvó adatra. Természetesen erre nemzedéktársak között is volt lehetőség, sajátos szimbolikus cserealapként. A gondolatok, vélemények, tanácsok, érdemi tartalmi útmutatások sajátos tudományos piacán korábban sokkal nagyobb mértékben volt jelen az adatismeret. Az elmúlt évszázad tudományos hivatkozásai jelentős részben szövegesen is kitérnek arra, hogy valamely adatot egyik vagy másik kollégájának köszöni a szerző. Az óriási szövegbankokban való tudományos kereshetőség leértékeli ezt az adatismeretet a tudományos közösségben, s ennek mértékében mintegy automatikusan felértékeli az elemző vagy kritikai természetű tudást, s a kollégáknak nyújtott effajta tudásra támaszkodó segítséget is.

A tudományos célra használható adat fizikai hozzáférhetőségének a jelentősége csökken, s ez részben átrendezi az erőviszonyokat. A könyvtárak, levéltárak, múzeumok munkatársainak közösségen belüli súlya – vagy éppen a nagyobb magánkönyvtárral rendelkező kutatók szívességpotenciálja – egyre kevésbé az adatok fizikai birtoklásán, a hozzáférés fizikai értelemben vett támogatásán vagy akadályozásán alapszik, sokkal inkább a digitalizálandó anyagok körének kijelölésén, illetve az ezzel kapcsolatos metaadat-kreáló tevékenységen, A nagy könyvtáraktól – vagy éppen a kutatott tárgytól –  fizikailag távol élő kutató információs hátránya csökken, csökken tehát a hatalmi súlya a néhány évtizeddel ezelőtt még ügydöntő jelentőségű kiküldetési díjak, utazási költségtérítések feletti diszponálásnak. Húsz évvel ezelőtt teljesen lehetetlen volt pl. hogy egy lengyel kistelepülésen élő történelemtanár forrásszintű tanulmányokat folytasson a 19. századi amerikai sajtótörténetről – ma ennek semmilyen technikai akadálya nincs.

A technikai értelemben vett hozzáférés kiterjedése ugyanakkor bumerángként is hat: egy konkrét tudományos teljesítmény nemzeti vagy nemzetközi értelemben vett sikerességének hiányát technikai nehézségekből – az adathozzáférés vidéki és fővárosi, perifériaország-béli vagy centrumország-béli eltérő esélyeiből levezető érvelés legitimitása csökken. Láthatóbbá és leplezhetetlenné válik egyes személyek, intézmények, egész nemzeti tudományos közösségek érdemi, intellektuális partikularizmusa, provincializmusa.[29]

A tudományos művek bírálóinak egyre kevésbé „kell” figyelembe venniük s „affirmative action”-ként kalkulálniuk azt a tényt, hogy egy mű a vizsgált jelenséggel azonos vagy távolabbi országban született-e. Ez pedig akár meg is növelheti az erős szelekcióval kiválasztott, a mainstream tudományos beszédmódot gyakorolni képesek versenyelőnyét.

További hatás – bár a humántudományok körében valóban csak a legszegényebb országokban élő tudósközösséget sújtja, s nem teremt olyan igazi skálát, mint a természettudományok művelői körében – annak növekvő jelentősége, hogy ki fér hozzá és ki nem az internetes, de nem ingyenesen hozzáférhető szövegekhez.[30]

Megnövekszik annak jelentősége, hogy a radikálisan megnövekedett adattömegben ki képes megfelelő módon keresni, ki tud személyes munkaidejével vagy megfizetett munkatársi munkaidőalappal rendelkezve adatot gyűjteni.

A digitalizálásra vonatkozó döntés, illetve a digitalizált forrásokkal kapcsolatos metaadat-készítésre irányuló döntés átrendezi a kutatók forráspreferenciáját. A disszertáció vagy cikktéma kiválasztásakor természetesen mindig szempont volt, hogy miről van és miről nincs hozzáférhető adat. A nagy könyvtárak, levéltárak közelében élő kutatók számára a kevéssé, vagy senki által fel nem dolgozott folyóiratok vagy iratcsomók csábereje nyilvánvalóan nagyobb volt. A digitalizáció után megnövekedett a szabadon kereshető, metaadatokkal segített, s nem utolsó sorban otthonról, vagy egyetemi irodából hozzáférhető források népszerűsége. Ez különösen abban az időszakban volt érzékelhető, amikor viszonylag kevés klasszikus forrás volt interneten hozzáférhető. A következő néhány évben „szinte minden” a netre kerül, a hozzáférhetőség, mint prefencia-átrendező hatás csökken, nem csökken azonban a metaadatokkal való ellátottság jelentősége. Mivel a metaadat-készítés igen jelentős élőmunkaerőt igényel, az  e felett diszponáló személyek és szervezetek továbbra is képesek befolyásolni a témaválasztást. Érdemes megfigyelni pl. a Magyar Elektronikus Könyvtárba bekerülő forrásokat a bekerülés időrendjében, illetve az OSZK főigazgató aláírásával még 2004-ben Hungarológiai Alapkönyvtár Digitalizálási program címen megjelent könyvlistát.[31] Ezeknek a forrásoknak a kiválasztása – mely több száz, talán több ezer digitalizálással foglalkozó tudományos intézmény vagy tudományos érdeklődésű magánszemély döntéseit tükrözi – az egyes témákkal kapcsolatos szimbolikus univerzumok közötti versengést mutatja.

Az interneten használható – s különösen az ingyenesen használható – kézikönyvek idézési valószínűsége lényegesen megnövekszik az interneten nem használható újabb könyvekkel szemben. A kiadói érdekek alapján számos modern kézikönyv nem, vagy csak igen korlátozott hozzáférhetőséggel kerül a netre (pl. a könyvet papíralapon is megvásárlók, vagy előfizetők számára). Ez növelte annak valószínűségét, hogy a régebbi, szabadon hozzáférhető kézikönyvek, ill. az ingyenes site-okra felhordott kivonatok szolgáljanak adatforrásul. A hatás analóg azzal a jelenséggel, ami az 1990 előtti kelet-európai könyvtárhelyzet eredménye volt: a kutatók – különösen a legjelentősebb egyetemi könyvtáraktól távol élők — a devizahiány következtében be nem szerzett korszerűbb kézikönyvek helyett régebbit vagy nyilvánvalóan gyengébb meglévőt használtak, idéztek. A digitalizálás jelensége — pontosabban a nem digitalizált művek makacs jelenléte – tehát felveti a korszerűtlen információk nagyobb terjedésének valószínűségét is. Az internet történetének egyik első nagy kézikönyv-digitalizációs programjának – az 1911-es Encyclopedia Britannicának — felületére belépve az olvasó azonnal figyelmeztetést kap, hogy a könyv adatai — elsősorban a természettudományos, orvosi, műszaki szócikkek – súlyosan elavultak, de hosszú évekig nem volt új Britannica a neten... Magyarországon ahol hosszú ideig csak a Pallas Lexikon volt elérhető, személyes tapasztalataim szerint a szakdolgozatokban gyakran köszöntek vissza a Pallas jellegzetes adatai, megközelítésmódjai, sőt stílusfordulatai.

Az új adatok keletkezése, a régi adatok újrahasznosulása még tovább bonyolítják azokat az erőviszonyokat, amelyek az egyes témákat kutató történészek, a lezárult dolgokat kutató nem történész identitású társadalom és bölcsészettudományi kutatók, a napjainkban is élő dolgok előzményeit és gyökereit bemutatni kívánó kutatók, a múlt társadalmi jelenségeit analógiaként és példatárként használó közvéleményformáló értelmiségiek között fennállnak. Ezek az erőviszonyok ugyanis természtesen kihatnak a forrásfeltárási, forráspublikálási folyamatokra, a tudományos művek megszületésére és elterjedésére – végső soron a tudomány egészére.

***

Az adatfeltárás, adatrendezés és adatelemzés jelenségvilága tehát egy komplex tudományszociológiai összefüggésrendszer része.

Funkcionalistán szólva: minden elemzés legnagyobb kihívása, hogy egyszerre kellene

 1. elemeznünk — úgy ahogyan vannak — a rendelkezésre álló adatokat; 
   
 2. megállapítanunk, hogy a rendelkezésre álló adatok mennyire reprezentálják, mennyire tükrözik annak a társadalomrésznek a viszonyait, amelyről szólni akarunk, azaz van-e olyan szisztematikus körülmény, ami pl. a „mintába kerülést,” a történelmi adat fennmaradását akadályozta stb.;
   
 3. megállapítanunk (pl analógiák, vagy hasonló kutatások alapján) hogy a rendelkezésre álló adatok, változók közül nem hiányzik e valamilyen alapvető adat, melynek hiánya az összes magyarázatot irreálissá teszi;
   
 4. megállapítanunk, hogy az adat-termelődés közegének nyelvi valósága az adatok mértékének mekkora homogenitását biztosítja, azaz, hogy minden adatszolgáltató számára többé kevésbé ugyanazt jelentik-e az adatszolgáltatás során használt szavak;
   
 5. mennyiben módosítják adatainkat a másoktól átvett vagy magunktól kitalált elemzési kategóriák....

Konfliktusos paradigmában beszélve: az önreflexió és álcázás sajátos dinamikáját fenntartva szólunk arról, hogy témaválasztásunk mennyire szabad és mennyiben megrendelt, adataink mennyire valósak és mennyire konstruáltak, hogy kategóriáink mennyire rugalmasak és mennyire előre programozottak, hogy hipotézisünk, illetve tanulságaink mennyire voltak meg előre és mennyire keletkeztek az elemzés eredményeképp, hogy doxikusan használt okságfogalmunk valójában mely tudományfilozófiai rendszer részeként legitim, illetve illegitim...

Egyszerre reflektáljuk és álcázzuk, hogy mennyiben vagyunk a tudományos gépezet fogaskerekei és mennyiben szabadon lebegő értelmiségiek.

Footnotes

 1. ^ A tanulmány illeszkedik a International cooperation in the social sciences and humanities. Comparative Socio-Historical Perspectives and Future Possibilities. c európai projektbe http://interco-ssh.eu/en/ melynek magyar partnere a WJLF (http://wesley.hu/sociology).
 2. ^ http://magyarnarancs.hu/belpol/a_regeszet_torvenyi_ujraszabalyozasa_kapa...
 3. ^ https://oi.uchicago.edu/research/projects/nubia-salvage-project
 4. ^ http://www.europeaninstitute.org/index.php/93-european-affairs/february-...
 5. ^ http://www.historia.hu/userfiles/files/2011-07/Jordan.pdf
 6. ^ http://www.nytimes.com/2001/03/19/world/19TALI.html
 7. ^ http://www.nytimes.com/roomfordebate/2014/10/08/protecting-syrias-heritage
 8. ^ http://beszelo.c3.hu/cikkek/a-%E2%80%9Ejelcin-dosszie%E2%80%9D E történeti forrásfeltárás – ahogy az az orosz levéltárügyet azóta is jellemezni látszik – maga is nagyhatalmi politikai célokat szolgált.
 9. ^ http://www.gcsu.edu/math/docs/2013Capstone/callahan.pdf A német tengeralattjáró-háború irányítására szóló kódrendszer megfejtésének története moralista diskurzusok alapjául is szolgált: legitim volt-e tudatosan feláldozni jelentős számú angol tengerészt, még több tengerész későbbi megmentése, illetve a háború sikeres befejezése érdekében.
 10. ^ Az első világháborús német kormány által megtárgyalt, a hadicélokra vonatkozó dokumentum robbantotta fel azt az önképet, miszerint a német vezérkar volt agresszív, a polgári politikusok pedig mérsékelni akartak, az utóbbiak tehát lehetnek egy mai Németország pozitív hősei... vö: http://www.tankonyvtar.hu/hu/tartalom/tamop425/2011_0001_520_bevezetes_a... és Szabó Miklós: Nyugatnémet vita az újabbkori német történelemről. - In: Világtörténet, 1987. (9. évf.), 4. sz., pp.131-142..
 11. ^ Komoróczy Géza (1988): Kiáltó szó a pusztában – A Holt-tengeri tekercsek, Osiris Kiadó, Budapest. A holt tengeri esszénus tekercsek– minthogy az Újszövetség szavait más kontextusban tartalmazzák – az Újszövetség szavainak isteni sugallmazásának megkérdőjeleződését jelentették.
 12. ^ A vikingek szerepe az orosz fejlődés önállóságának megkérdőjelezéséhez jelent muníciót Szvák Gyula2005): A rendszerváltó évtized magyar történeti ruszisztikája. - In: Világtörténet, (27. évf.), tavasz/nyár, pp. 104-111.  Lásd még: Szili Sándor(2000): A „kolonizáció” problematikája az orosz és a szovjet historiográfiában. - In: Világtörténet,. (22. évf.), tavasz/nyár, pp. 3-22.    Bourdieu, Pierre (2009): A tudományos mező; ford. Fáber Ágoston . In.:Replika 20. évf. 67. sz. , pp. 11-36. Uő: A tudomány tudománya és a reflexivitás : a Collčge de France 2000-2001. évi előadás-sorozata / ; [szerk. és a szöveget gond. Lenkei Júlia] ; [ford. Házas Nikoletta, Simon Vanda],2005,  Gondolat, Budapest.
 13. ^ Komoróczy Géza(1988): Tartalmában strukturalista, formájában nemzeti. Sz. A. Tokarev, szerk., Mitológiai enciklopédia. A magyar kiadás szerkesztője: Hoppál Mihály (Budapest: Gondolat), BUKSZ: Budapesti Könyvszemle, 2, No. 2 (1990. nyár), pp. 164-175.
 14. ^ http://epa.oszk.hu/00000/00011/00106/pdf/iskolakultura_EPA00011_2006_07_...
 15. ^ http://real-j.mtak.hu/614/1/TARSFILTORT_22.pdf
 16. ^ http://mek.oszk.hu/02200/02228/html/01/160.html
 17. ^ http://www.tankonyvtar.hu/en/tartalom/historia/80-02/ch15.html
 18. ^ http://mumia.art.pte.hu/periszkop/Musorok/history/ceram_-_a_regeszet_reg...
 19. ^ http://www.bbc.co.uk/bbcfilms/catalogue
 20. ^ http://filozofiaiszemle.net/wp-content/uploads/2015/01/Schwendtner-Tibor...
 21. ^ A tudósok várható élettartamának növekedése ugyan elmarad a népesség egészében megfigyelhető növekedéstől, de mégis egyértelmű, hogyha a huszadik század minden békés évtizedére megvizsgáljuk az adott évtizedben elhunyt neves tudósok megélt éveinek átlagos számát.
 22. ^ http://nemzetikonyvtar.blog.hu/2012/03/03/hogyan_kutassunk_klimat_2_resz...
 23. ^  http://www.sciencemag.org/content/343/6172/747
 24. ^ Babarczy Anna(2006) : Számítógépes nyelvészet.  In.:Látás, nyelv, emlékezet. - Budapest: TypoTEX.- pp. 111-124.
 25. ^ Kovács Ákos András(2013): A történetírás mint tudomány . - In: Buksz :,  (25. évf.), 2. sz., 140-144. , Z. Karvalics László(1996): Az információtörténeti gondolkodás ágazatai, kiindulópontjai és kezdetei . - In: Világtörténet,  (18. évf.), ősz/tél, pp. 10-25. Gyáni Gábor(1986): Az „új történetírás” jelensége. - In: Világtörténet, (8. évf.), 3-4. sz., pp. 3-6. Fogel, R. W.(1986): „Tudományos” és tradicionális történetírás . - In: Világtörténet,  (8. évf.), 3-4. sz., pp.7-39.; Zeldin, T(1986).: Társadalomtörténet és totális történet . - In: Világtörténet. (8. évf.), 3-4. sz., pp. 40-52..; Kocka, J.(1986): Elméletek és kvantifikáció a történetírásban. - In: Világtörténet, . (8. évf.), 3-4. sz., pp.53-62.
 26. ^ A bio-bibliográfia 1890 és 1914 között füzetenként jelent meg és összesen 29.553 magyar „író” (mármint mindenki, aki írt, köztük mérnökök, tudósok, orvosok stb) életrajzát tartalmazza.
 27. ^ http://www.leveltaros.hu/sites/default/files/Anglia.pdf
 28. ^ http://epa.oszk.hu/01500/01551/00065/pdf/EPA01551_educatio_13_03_405-412...
 29. ^ Lásd az angol felülreprezentációt, román lengyel  alulreprezentációt a nemzeti kvóták nélküli európai tudományos források pályázatnyertesei között.  http://erc.europa.eu/projects-and-results/erc-funded-projects
 30. ^ http://www.teachingcouncil.ie/research/ebsco.2324.html
 31. ^ http://mek.oszk.hu/hungalap/