Óriás szövegtárak és szótárak használata (TMLookup)

A Farkas András fordító által készített TMLookup nyílt forráskódú programmal kétnyelvű és többnyelvű szöveges adatbázisokban (fordítási memóriákban) és szószedetekben kereshetünk gyorsan. Ez az ingyenes eszköz olyan hatalmas memóriákban és szószedetekben is gyorsan megtalálja, amit keresünk, amelyeknek a kezelésébe a kereskedelmi fordítástámogató programoknak már beletörik a bicskájuk (sok millió bejegyzés esetén). A TMLookup több nyelvet is képes kezelni és a keresési eredményeket akár egy másodperc alatt is visszaadhatja, még akkor is, ha az adatbázis tízmillió bejegyzést tartalmaz.

A programot jól használhatjuk fordítástámogató eszközünk kiegészítésére, túl nagy méretű adatbázisaink összehangolt kereséséhez. Importálhatjuk az összes saját memóriánkat és szószedetünket, illetve a neten elérhető hatalmas memóriákat (pl. EU-s joganyag, amelyeket először többnyire át kell alakítanunk, de meg is lehet vásárolni az átalakított memóriát vagy szószedetet a program szerzőjétől).

Az alábbiakban egy 460 ezer szócikket tartalmazó angol-magyar szótár segítségével mutatom be a program telepítését és használatát. A szótárfájlt Bordács Mihály fordító készítette elő. A szótárfájl letölthető innen: http://wordfisher.com/enhualap.zip

Letölthető még egy szintén általa készített magyar-német szótár (kb. 330 ezer szócikk) innen: http://wordfisher.com/hude-base.zip és egy magyar-holland szótár is (kb. 150 ezer szócikk) innen: http://wordfisher.com/maho.zip

A szótárfájl letöltése után a TMLookup program honlapjáról, a DOWNLOAD hivatkozásra kattintva töltsd le a program legújabb verzióját.

1. TELEPÍTÉS

A letöltött ZIP-fájlban levő [TMLookup] könyvtárat pl. a D:\ meghajtóra csomagold ki. Ugyanebbe a könyvtárba csomagold ki a szótárfájlt is. Ekkor ezek a fájlok lesznek a könyvtárban:

A program ezután a d:\TMLookup\TMLookup.exe programmal indítható. A programon jobb egérgombbal kattintva, a Küldés lehetőséget választva az asztalon parancsikont is létrehozhatsz a program gyors indításához.

2. FÁJLOK ELŐKÉSZÍTÉSE

A letöltött szótárfájl már megfelelően elő van készítve, UTF-8 kódolású TAB-delimitált szövegfájl. A szövegfájlok kódolása ellenőrizhető és módosítható számos ingyenes TEXT editorral, ilyen pl. az EditPad Lite.

A TMLookup program új verziójában a honlapon szereplő .TMX és UTF-8 kódolású .TXT szövegfájlokon kívül .XLS és Trados .SDLTM fájlok is beolvashatók és kezelhetők akár egyetlen hatalmas memóriaként.

3. AZ ELSŐ ADATBÁZIS LÉTREHOZÁSA

A program elindítása után File / Create new database (Ctrl-N) parancsra megnyíló ablakban be kell írni a megfelelő FORRÁS és CÉLNYELVI kódot, pl. angol-magyar esetén en és hu.

Ezután kattints a Start gombra.

A megjelenő ablakban ki kell választani az adatbázis HELYÉT és meg kell adni a NEVÉT.

HELYKÉNT a program d:\TMLookup\ könyvtárát javaslom, mert ha ezt következetesen betartod, akkor egy pendrive-on is hordozható szótárad lesz. A NÉV megadásakor célszerű a név végére a NYELVPÁRT beilleszteni, ez megkönnyíti a későbbi azonosítást, pl. general-en-hu

Ezután kattints a Mentés gombra.

4. ADATBÁZIS FELTÖLTÉSE TARTALOMMAL

Az aktuális (megnyitott) adatbázis neve a program ablakának címsorában mindig látható. Jelen esetben: general-en-hu.db

Amikor először használod a programot, és létrehoztad az adatbázist, az adatbázis még üres. Ebbe lehet betölteni az adatokat a TMX, XLS, SDLTM vagy TXT fájlokból.

A betöltés menete:

Az Edit/Import file(s) into active database parancs és a Start gomb lenyomása után megjelenő ablakban válaszd ki az importálandó forrásfájlt. Noha több fájl is kiválasztható (ha a belső szerkezetük azonos), a biztonság kedvéért az egyenként való importálást javaslom.

Kattints a Megnyitás gombra. A beállításnál ügyelj arra, hogy az adatbázis és az importálandó fájl nyelvei és a nyelvi irány megfelelő legyen!

Kattints a Start gombra. Az importálás végén megjelenik az összesítő.

5. KERESÉS AZ ADATBÁZISBAN

Ezután már kereshetünk az adatbázisban. Keressünk rá a lekváros szóra.

Ha csak a teljes szót tartalmazó bejegyzéseket szeretnéd látni, jelöld be a Match whole words jelölőnégyzetet.

Ha szeretnéd látni, szerepel-e a bukta szó is valahol a kifejezésekben, írd be a segédmezőbe a bukta szót, és kattints a Filter (Szűrés) gombra.

Ugyanerre az eredményre vezet, ha “lekváros bukta” kifejezésre keresel, és bejelölöd az Add quotes jelölőnégyzetet. (Ha nincsenek idézőjelek, akkor minden olyan bejegyzést látunk, ahol a szócikkben bárhol előfordul a két szó, ha van idézőjel, akkor csak azokat látjuk, ahol kifejezésként egymás mellett szerepelnek. Ennyiben hasonlít a Google keresőjében végzett kereséshez.)

6. KONTEXTUS MEGJELENÍTÉSE

Előfordulhat, hogy a megjelenített szócikk nem értelmezhető vagy hiányos. Ilyenkor segíthet a találat környezetének, a kontextusnak a megjelenítése. Ilyenkor kattintsunk az egérrel a bal szélső cellába a sorszám mellé, majd válasszuk az Edit/Show context menüparancsot. Ekkor már értelmezhetjük a bejegyzést, és az előző sorban megtaláljuk a jelentését.

7. ÚJABB ADATBÁZIS LÉTREHOZÁSA PL. MÁS NYELVPÁRHOZ

Más nyelvpárhoz vagy témakörhöz új adatbázist a fenti 3. pont szerint lehet létrehozni és a 4. pont szerint tartalommal feltölteni.

8. ADATBÁZIS KÉSŐBBI BŐVÍTÉSE

Ha nem a kívánt adatbázis van megnyitva, vagyis nem annak a neve szerepel a program ablakának címsorában, amelyiket bővíteni szeretnéd, akkor a File/Open database (Ctrl-O) paranccsal nyisd meg az adatbázist. Ezután a 4. pontban leírtak szerint importálható a további tartalom.

9. ADATBÁZIS TISZTÍTÁSA

Az Edit/Remove duplicates from database paranccsal az ismétlődő bejegyzések törölhetők az adatbázisból.

Megjegyzés: Az Edit menüben található egy Export lehetőség TAB-delimitált TXT fájlba. Ez felhasználható arra például, hogy a különböző korábbi forrásaidból egybeömlesztett, majd duplikátumoktól megtisztított szótáradat egyetlen fájlba exportáljad.

10. VÁLTÁS AZ ADATBÁZISOK KÖZÖTT

Ha nem az az adatbázis van megnyitva a kereséshez, amelyiket használni szeretnél, vagyis nem annak a neve szerepel a program ablakának címsorában, akkor a File/Open database (Ctrl-O) paranccsal nyisd meg a kívánt adatbázist.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöljük.