Új keresés

Rövid használati utasítás a Répertoire de la poésie hongroise ancienne 7.1. változatához

Az adatbázis új belső szerkezete

Az adatbázis új kiadása jelentős átstrukturálás eredménye, melyet a későbbiekben elkészülő teljes leírás fog részletesen ismertetni. A jelenlegi változat tartalmazza a 6. változat elkészítése során visszatáplált, korábban elérhetetlen változat-adatlapok információit, ugyanakkor ezeket egy redundancia-mentes relációs adatmodellben tárolja, az eredeti két táblázat helyett 48, egymással logikai kapcsolatban álló adattáblában.

Az adattáblák információit a könnyebb használhatóság érdekében külön program rendezi egyetlen redundáns, ugyanakkor szemléletes táblázatba. Ennek rendezőelve az RPHA-számmal ellátott versek és az azonosított források metszete: a versváltozatok azonosítása. Az új táblázatban tehát minden vers minden rögzített változata külön adatsort kap, melyben a szerkesztők által fontosnak ítélt adatok találhatók meg. A korábbi verziók főadatlapjai mint a versek virtuális változatai szerepelnek, mivel ezeknek a szerkesztett adatoknak a Repertórium a forrása.

Az átstrukturálás részeként több, korábban nem ismert beviteli hiba javítására is sor került, ugyanakkor a jelenlegi tesztfázis azt a célt is szolgálja, hogy az átalakításkor vagy a nézettábla létrehozásakor bekövetkezett esetleges adatromlásra fény derüljön. Az átalakítás lépései visszakövethetők, így az adatbázis rejtett táblázatban tartalmazza az 5. és 6. változat teljes anyagát.

A fejlesztés alatt álló megjelenítő-felület

Az adatbázist kétféle módon lehet elérni. Jelenleg már használható formában van a korlátozott képességű, de kényelmes és szemléletes webes megjelenítőfelület. A fejlesztés még korai szakaszában van, de a felület már most működik. Ugyanakkor nyilvános hozzáférést biztosítunk az adatbázis belső szerkezetéhez, melyet bármely SQL-klienssel el lehet érni, így kikerülve a kényelmes felület korlátait. Az alábbiakban a webes felület használatáról és a nézettábla szintaxisáról lesz szó.

Keresés

A kezdetleges keresőlapon négy szempontot lehet megadni. Az algoritmus csak azokat a szempontokat veszi figyelembe, amelyeknél meg van adva a kívánt érték. Az első keresőmező értékét mindenképpen ki kell tölteni. Minden szempont mellett logikai kapcsoló található.

A keresés nem érzékeny a kis- és nagybetűk különbségeire, az ékezetekre, a vesszőkre, pontokra, kötőjelekre és szóközökre. Az üresen maradt keresőmezők nem korlátozzák a keresés eredményét.

Az egyszerűsített keresőfunkció mindig szöveget keres tartalmát az SQL 'LIKE' kulcsszavának szintaxisa szerint kell megformálni. Vannak különleges karakterek, ezek közül a két legfontosabb a százalékjel (%), amely nulla vagy több tetszőleges karaktert helyettesít, illetve az alulvonás (_), amely pontosan egy darab karakter helyét jelöli. A felület a megadott érték elé és után automatikusan százalékjelet tesz, tehát a megadott érték előtt és után akárhány karakter előfordulhat. Ezért általában érdemes csak annyira megadni a keresőmező értékét, amennyire feltétlenül szükséges, illetve furcsa keresési eredmény esetén érdemes átgondolni a keresőkérdést. Például amennyiben azt a verset keressük, amelyben az akrosztichon szerint "Tinodi Lantos" a szerző, és ennek megfelelően töltjük ki a "Szerző" rovat keresőmezejét, nem kapunk eredményt. Ez esetben elhagyhatunk valamit a megadott értékből. "Tinodi" érték esetén Tinódi Sebestyén 28 műve jelenik meg, "Lantos" érték esetén pedig 2 mű. Ezek egyikében az akrosztichon adata "Tinodii Lantos Sebestien deiak" - az első keresés a dupla i betű miatt nem hozott találatot.

Keresés dátumra

Számértékek keresésénél különösen fontos ügyelni a szintaxisra.

A keresés eredményei

Az eredménylap azon versek adatait tartalmazza, amelyeknek valamely változatára illeszkednek a keresési feltételek. Az adatok a főadatlapról származnak; a teljes adatlap a kiválasztott vers RPHA-számára kattintva érhető el. Az adatlap az egyszerűsített kereső használatakor a kiválasztott mezők adatait tartalmazza. Mivel a keresőmezők üresen hagyhatók, ezzel lehetővé válik a fontos szempontok gyors áttekintése. Például első feltételként a "Szerző" mezőt kiválasztva megadhatjuk a "Balassi" értéket, majd a többi mezőnél a "Versforma", "Incipit", "A szereztetés ideje" mezőket kiválasztva, az értékeket üresen hagyva a keresés eredményeként Balassi Bálint verseinek metrikai áttekintését kapjuk anélkül, hogy az egyes adatlapokat be kellene hívnunk.

Adatlapok

Az adatlapokon a főadatlapi információk félkövérrel szedve láthatók, és ezt követik minden mező esetében azon változatok releváns adatai, amelyeknél ezeket az adatbázis tartalmazza. Így az adatlap böngészése közben a különösen érdekes változatok előtérbe kerülnek. Az egyes forrásokra kattintva az adott változatról elérhető összes adat jelenik meg. Hamarosan elkészül az a lap is, amely a versek forrásául szolgáló könyvek adatait és tartalomjegyzékét tartalmazza.

Változásnapló

Általános jellemzője ennek a változatnak, hogy sehol nem alkalmaz hibakezelést, tehát előfordulhat, hogy a felhasználó pl. üres keresési eredmény esetén programozói hibaüzenettel találkozik. Ugyanakkor ezek a hibaüzenetek a fejlesztési fázisban igen informatívak, ezért a hibakezelés csak a készülő 8.0 változatnál lesz majd felhasználóbarát.

2021. április 24.

Élesítettük az RPHA felületének egy új változatát. A versadatlapok áttekinthetőbben jelennek meg, a felhasználó a metaadatok szempontjai, valamint a versek szövege és dallama között fülek segítségével válthat. Az új felület még finomításokra szorul, de máris könnyebben kezelhető az előző változatnál. Azoknál a verseknél, ahol a szöveg még nem került föl az adatbázisba, de elérhető legalább egy digitalizált forrás, a rendszer egy ilyen forrás képét tölti be. Az automatikus párosítások előnye, hogy immár 1027 vers esetében elérhető legalább egy ilyen forrás, hátránya azonban, hogy előfordul, hogy a forrás nem pontosan a megfelelő oldalnál jelenik meg. Az ilyen hibákkal kapcsolatos visszajelzéseket megköszönjük. A felületet a felhasználók biztonságának érdekében elsősorban nyílt forráskódú böngészőkön teszteljük.

Az adatok részletessége is javult néhány vers esetében. Az adatbázis első nyilvános kiadásakor a Régi Magyarországi Nyomtatványok két kötete jelent csak meg. Az azóta megjelent további két kötet sorszámai ezért hiányoztak az adatbázisból. Most a konkordancia-táblázatok adatai szerint e két kötet sorszámai, valamint visszamenőlegesen a régi kötetek RMNy-számai mellett a megfelelő RMK-sorszámok is felkerültek az adatbázisba. A rendszer folyamatos átalakítása miatt ezek a konkordanciák (és az RMDT 1958-as és 2017-es kiadása közötti átváltások) még nem működnek a keresőfelületen, csak a versek adatlapján szerepelnek. Összességében 6598 új hivatkozás került az adatbázisba. A felület annyira megváltozott, hogy kénytelenek vagyunk beismerni: ez már a 7.3. változat.

2021. március 22.

Az RPHA meg nem jelent 6. változatán Király Péter, majd Simon Zsolt is dolgozott. Munkájuk mellékterméke volt egy RMNY/RMK-MEK-összekötő táblázat, melynek segítségével további körülbelül 50 vers digitalizált változatát sikerült feltölteni (néhol pontos oldalmegjelöléssel, néhol kötetszinten). Így most az adatbázisban szereplő 1523 vers közül 873-nál legalább egy, de esetenként három forrás is elérhető. Az adatbázis némely változatadatlapjánál elérhető betűhű átirat is - itt nem áruljuk el, mely versekről van szó, csak annyit, hogy egy új szövegkiadás munkálatai folynak.

2021. március 14.

Ferenczi Ilona és Meszéna Beáta segítségével, A XVI. század magyar dallamai kiadásához használt forrásfájlok alapján elkezdődött a gépileg feldolgozható dallamok előkészítése. Ahol már elkészült az ellenőrzött gépi kotta, az oldal újraszedett kottaképet mutat, és a kotta alatt a dallam lejátszható hangfájlként is megtalálható. A kották forrásául szolgáló LilyPond kód az adatbázisban elérhető, így szervesen összekapcsolódik az RPHA többi részével - nem utolsósorban a már felvitt szövegekkel.

2021. február 25.

A keresőlapon látható a műfajfa, melynek elemei a megfelelő keresési oldalt hívják be.

2021. február 24.

Tóth Tünde javaslata alapján bekerült az adatbázisba Balassi Bálint két elveszett verse (Caelia 1, MKIK 31). Folytatódik a szövegek feltöltése, valamint az adatbázis most már a versek több mint felénél össze van kötve legalább egy digitalizált forrással.

2021. február 12.

Teljessé vált az RMDT-vel való összeköttetés. Az adatbázisban szerepelnek a csak a 2017-es kiadásban szereplő dallamok, valamint minden dallam össze van kötve a hozzá tartozó jegyzettel. A jegyzetek eléréséhez továbbra is MERSZ-hozzáférés szükséges, és ez a belátható jövőben valószínűleg nem fog változni.

2021. február 10.

Tovább javult az összeköttetés az RMDT-vel. A dallamok most már MERSZ-előfizetés nélkül is láthatók (noha továbbra is a MERSZ oldaláról töltődnek be), valamint az 1958-as kiadásban még nem szereplő dallamok jelentős része is bekerült az adatbázisba (s ez a feltöltés hamarosan teljes lesz). Hasonlóképp a dallamok jelentős részénél a jegyzetekre való hivatkozás is megjelenik. Erre kattintva a böngészőben új fülön a MERSZ oldala jelenik meg, a megfelelő dallamhoz tartozó jegyzetnél. Ehhez a funkcióhoz továbbra is MERSZ-előfizetés szükséges. A MERSZ sok egyetemi és egyéb tudományos hálózatról bejelentkezés nélkül is elérhető. Az RMDT-funkció és a szövegek megjelenésének lehetősége a 7.2. változat újdonsága.

2021. február 6.

Elkészült az adatbázis összeköttetése a Régi Magyar Dallamok Tára (RMDT) új, online kiadásával. Mivel az RMDT az Akadémiai Kiadó Zrt. gondozásában jelent meg, a funkció használatához MERSZ-előfizetés szükséges. Ugyanakkor az összeköttetés révén az adatbázisba bekerültek az új, 2017-es kiadás dallamsorszámai is, illetve néhány eddig hiányzó RMDT-hivatkozás is a helyére került.

2021. január 31.

Elkezdődött a versek szövegeinek feltöltése az adatbázisba. Először A Régi Magyar Költők Tára (RMKT) II. kötetének anyaga került be, de a feltöltés folyamatos, és terveink szerint végül a 16. századi RMKT anyagának nagy része itt is elérhető lesz. A versek átalakításának ellenőrzése is folyamatban van.

2021. január 17.

Több mint fél év tesztidőszak után az RPHA 7. változatát működőnek tekintjük. A felület kezdetleges, de a korábbi változatoknál informatívabb. Az adatbázis átalakítása, úgy tűnik, sikerült. Az utóbbi hónapokban több adatot korrigáltunk az újabb kutatási eredményeknek megfelelően. A mostani lekérdező-felület fejlesztése befejeződött; jelenleg a 8. változat fejlesztése zajlik, mely az adatbázis nemzetközi integrációját és egy letisztult kezelőfelületet is lehetővé tesz.

Fontos újdonság, hogy a honlap a végleges helyére költözött. Amellett, hogy az adatbázis legfrissebb változata a későbbiekben remélhetőleg az ELTE és az OSZK honlapjáról is elérhető lesz, szándékunk szerint a jelenlegi helyen (https://f-book.com/rpha) hosszú távon elérhető lesz. Ennél is lényegesebb, hogy mostantól a lekérdezési eredmények is megbízható hivatkozások. A 8. és későbbi kiadások megjelenésekor nem cseréljük ki a lekérdezési szintaxist, hanem, mivel a jelenlegi hivatkozások is tartalmazzák a verziószámot, a régi lekérdezéseket továbbra is megfelelő módon tudja majd kezelni a rendszer. Ezzel a – még korántsem hibátlan – 7. változat elkészült.

2020. szeptember 24.

Megjelent a keresőlap alján található impresszum és adatkezelési nyilatkozat – a tárhelyszolgáltató elhelyezkedése miatt egyelőre németül.

Az elmúlt hónapok fejlesztései az adatmodellre koncentráltak. Fejlesztés alatt áll az adatbázis kész változata, mely várhatólag jelentős újdonságokkal és letisztult, kényelmes kezelőfelülettel szolgál majd.

2020. június 14.

Mostantól a forrásoknál megjelenik a szkennelt változat képe - amennyiben ezt az összeköttetést már létrehoztuk. Az adatbázisban szereplő körülbelül 800 könyvből eddig 13 esetben végeztük el az összekötést, de így már 462 vers esetében elérhető legalább egy forrás digitalizált változata. A digitalizált versek listája a "Forrás" mező "digitalizált" értékére történő kereséssel érhető el. A lapszámokat kézi végigellenőrzésével még nem végeztünk, ezért egy-két lapozásra szükség lehet a pontos hely megtalálásához.

Új funkció a reguláris kifejezések használatának lehetősége. A keresési mezőknél beállítható "toleráns" változat az eddig is elérhető módszert alkalmazza. A "REGEXP" beállítás alkalmazásával reguláris kifejezésekre vált a kereső adott mezeje, tehát a két beállítás kombinálható egy keresésen belül. A reguláris kifejezések pontos szabványát a MariaDB adatbázisszerver használati utasítása tartalmazza, de számos internetes oldalon megtalálható e módszer leírása. A reguláris kifejezésű keresőmező tartalmának a keresett mező teljes tartalmát le kell írnia (REGEXP nyelven "^" kerül elé és "$" kerül a végére a lekérdezés összeállításakor. Aki nem ismeri a REGEXP szabályait, annak is hasznos lehet ez a beállítás: ha csak betűket és szóközöket használunk, így lehet egy mező teljes tartalmára keresni.

A REGEXP ilyen használata például rímképleteknél lehet hasznos. Amíg a toleráns keresés az "a a" keresőértékre kiadja a négysoros bokorrímű verseket is, a REGEXP beállításnál valóban csak a kétsoros versszakú párrímes versek listája fog megjelenni.

2020. június 13.

Lesznek még finomítások a "Mező értékeinek gyakorisága" oldal lekérdezéseiben, de most már használható a felület. Ennél a keresésnél is megadható a mező kívánt értéke (NEM logikai művelettel is). Az eredménytáblában a mezőfejlécre kattintva a mező értékei ábécésorrendbe rendezve jelennek meg, míg a gyakoriság oszlopfejléceire kattintva ezek szerinti lesz a rendezés.

2020. június 12.

Az adatlapok interaktivitása növekedett. Az egyes műfaji besorolásokra kattintva a felhasználó láthatja az abba a műfajba tartozó összes vers listáját. Hasonlóan lehet eljárni a versformával és a versforma típusával, a rímképlettel, a szótagszámmal, a címmel, a szerzővel, a terjedelemmel, a felekezettel és az úzussal is. A változatadatlapon a forrást tartalmazó könyv címére kattintva az abba a könyvbe tartozó versek listája jelenik meg, így egy-egy kötet virtuális, incipit alapján rendezett tartalomjegyzékét kapja meg a felhasználó.

Kidolgozás alatt áll, kísérleti stádiumban van az egyes mezők értékeinek összesítő táblázata is. Ez a fő keresőlapon a "Mező értékeinek gyakorisága" cím alatt található, és, bár technikailag megbízható adatokat szolgáltat, egyelőre csak kísérletezésre alkalmas —  noha például a rímképletek esetén a kísérletezés is érdekes lehet.

2020. június 11.

Mostantól a keresés eredményeinél a pontos találatok piros színnel és dőlt betűvel kiemelve látszanak. A nézettábla átláthatóságát tovább javítottuk. Minden keresésnél megjelenik az incipit. Az SQL-lekérdezőmezőt ideiglenesen kiiktattuk, mert nem minden lekérdezés volt kompatibilis a próbaverzió felületével. A fejlesztés alatt álló végleges felületen természetesen lesz lehetőség bonyolultabb lekérdezésekre is.

2020. június 10.

Mostantól a keresés eredményei nem csupán a főadatlapi adatokat, hanem a keresési feltételeknek megfelelő versváltozatok adatait is tartalmazzák. Így könnyebb értékelni a keresés eredményét, és a főadatlap mellett az egyes változatok adatlapjaira is egyetlen kattintással el lehet jutni.

Kisebb módosítások történtek a felület stílusában is.

2020. június 6.

Mostantól a versek teljes műfaji besorolására rá lehet keresni. Így az "ünnepi lelki" műfaji keresés 303 találatot ad vissza. Ezek a "mindennapi v. ünnepi lelki ének" besorolású versek, s ezen belül előfordulnak "halálrakészítő", "dicséret", "könyörgés" és más műfaji besorolású művek is.

2020. június 4.

Mostantól az eredménytábla a keresésnél megadott mezők adatait tartalmazza, így pontosan a felhasználót érdeklő szempontok jelennek meg.

Az adatbázissal kapcsolatos tervekről és további lehetőségekről

Aki ismeri a LibreOffice Base, Microsoft Access vagy más adatbáziskezelő programok működését, az már most közvetlenül csatlakozhat az RPHA-adatbázishoz. Ezáltal igen bonyolult keresőkérdéseket is föltehet, illetve lehetősége nyílik olyan programokkal való összekapcsolásra, mint pl. az Orange adatvizualizációs eszköz. A kapcsolódáshoz szükséges adatokért a programozónak (Horváth Andor, andorrr[at]gmail.com) kell levelet írni.

Ismert hibák

Egy régebbi verzió adatbeviteli hibája miatt az adatbázisban egyes források duplán szerepelnek, egyszer '0000' lapszámmal, egyszer pedig lapszám nélkül. Ezekben az esetekben a hivatkozás valójában lapszám nélküli, ezért a megjelenítő felületen a téves '0000' már nem jelenik meg. Ugyanakkor az ezáltal duplázott változatrekordok törlése előtt kézi ellenőrzés szükséges, nehogy adatvesztés történjen. Amíg ez meg nem történik, a 18088 versváltozat közül 237 duplán jelenik meg. A duplázott rekordok különböző mennyiségű adatot tartalmaznak, ezért ilyenkor érdemes mindkét változatadatlapot megvizsgálni. A következő két linkre kattintva megtekinthető egy ilyen adatlap és a párja.