Óriás szövegtárak és szótárak használata (TMLookup)

A Farkas András fordító által készített TMLookup nyílt forráskódú programmal kétnyelvű és többnyelvű szöveges adatbázisokban (fordítási memóriákban) és szószedetekben kereshetünk gyorsan. Ez az ingyenes eszköz olyan hatalmas memóriákban és szószedetekben is gyorsan megtalálja, amit keresünk, amelyeknek a kezelésébe a kereskedelmi fordítástámogató programoknak már beletörik a bicskájuk (sok millió bejegyzés esetén). A TMLookup több nyelvet is képes kezelni és a keresési eredményeket akár egy másodperc alatt is visszaadhatja, még akkor is, ha az adatbázis tízmillió bejegyzést tartalmaz.

A programot jól használhatjuk fordítástámogató eszközünk kiegészítésére, túl nagy méretű adatbázisaink összehangolt kereséséhez. Importálhatjuk az összes saját memóriánkat és szószedetünket, illetve a neten elérhető hatalmas memóriákat (pl. EU-s joganyag, amelyeket először többnyire át kell alakítanunk, de meg is lehet vásárolni az átalakított memóriát vagy szószedetet a program szerzőjétől).

Az alábbiakban egy 460 ezer szócikket tartalmazó angol-magyar szótár segítségével mutatom be a program telepítését és használatát. A szótárfájlt Bordács Mihály fordító készítette elő. A szótárfájl letölthető innen: http://wordfisher.com/enhualap.zip

Letölthető még egy szintén általa készített magyar-német szótár (kb. 330 ezer szócikk) innen: http://wordfisher.com/hude-base.zip és egy magyar-holland szótár is (kb. 150 ezer szócikk) innen: http://wordfisher.com/maho.zip

A szótárfájl letöltése után a TMLookup program honlapjáról, a DOWNLOAD hivatkozásra kattintva töltsd le a program legújabb verzióját.

1. TELEPÍTÉS

A letöltött ZIP-fájlban levő [TMLookup] könyvtárat pl. a D:\ meghajtóra csomagold ki. Ugyanebbe a könyvtárba csomagold ki a szótárfájlt is. Ekkor ezek a fájlok lesznek a könyvtárban:

A program ezután a d:\TMLookup\TMLookup.exe programmal indítható. A programon jobb egérgombbal kattintva, a Küldés lehetőséget választva az asztalon parancsikont is létrehozhatsz a program gyors indításához.

2. FÁJLOK ELŐKÉSZÍTÉSE

A letöltött szótárfájl már megfelelően elő van készítve, UTF-8 kódolású TAB-delimitált szövegfájl. A szövegfájlok kódolása ellenőrizhető és módosítható számos ingyenes TEXT editorral, ilyen pl. az EditPad Lite.

A TMLookup program új verziójában a honlapon szereplő .TMX és UTF-8 kódolású .TXT szövegfájlokon kívül .XLS és Trados .SDLTM fájlok is beolvashatók és kezelhetők akár egyetlen hatalmas memóriaként.

3. AZ ELSŐ ADATBÁZIS LÉTREHOZÁSA

A program elindítása után File / Create new database (Ctrl-N) parancsra megnyíló ablakban be kell írni a megfelelő FORRÁS és CÉLNYELVI kódot, pl. angol-magyar esetén en és hu.

Ezután kattints a Start gombra.

A megjelenő ablakban ki kell választani az adatbázis HELYÉT és meg kell adni a NEVÉT.

HELYKÉNT a program d:\TMLookup\ könyvtárát javaslom, mert ha ezt következetesen betartod, akkor egy pendrive-on is hordozható szótárad lesz. A NÉV megadásakor célszerű a név végére a NYELVPÁRT beilleszteni, ez megkönnyíti a későbbi azonosítást, pl. general-en-hu

Ezután kattints a Mentés gombra.

4. ADATBÁZIS FELTÖLTÉSE TARTALOMMAL

Az aktuális (megnyitott) adatbázis neve a program ablakának címsorában mindig látható. Jelen esetben: general-en-hu.db

Amikor először használod a programot, és létrehoztad az adatbázist, az adatbázis még üres. Ebbe lehet betölteni az adatokat a TMX, XLS, SDLTM vagy TXT fájlokból.

A betöltés menete:

Az Edit/Import file(s) into active database parancs és a Start gomb lenyomása után megjelenő ablakban válaszd ki az importálandó forrásfájlt. Noha több fájl is kiválasztható (ha a belső szerkezetük azonos), a biztonság kedvéért az egyenként való importálást javaslom.

Kattints a Megnyitás gombra. A beállításnál ügyelj arra, hogy az adatbázis és az importálandó fájl nyelvei és a nyelvi irány megfelelő legyen!

Kattints a Start gombra. Az importálás végén megjelenik az összesítő.

5. KERESÉS AZ ADATBÁZISBAN

Ezután már kereshetünk az adatbázisban. Keressünk rá a lekváros szóra.

Ha csak a teljes szót tartalmazó bejegyzéseket szeretnéd látni, jelöld be a Match whole words jelölőnégyzetet.

Ha szeretnéd látni, szerepel-e a bukta szó is valahol a kifejezésekben, írd be a segédmezőbe a bukta szót, és kattints a Filter (Szűrés) gombra.

Ugyanerre az eredményre vezet, ha “lekváros bukta” kifejezésre keresel, és bejelölöd az Add quotes jelölőnégyzetet. (Ha nincsenek idézőjelek, akkor minden olyan bejegyzést látunk, ahol a szócikkben bárhol előfordul a két szó, ha van idézőjel, akkor csak azokat látjuk, ahol kifejezésként egymás mellett szerepelnek. Ennyiben hasonlít a Google keresőjében végzett kereséshez.)

6. KONTEXTUS MEGJELENÍTÉSE

Előfordulhat, hogy a megjelenített szócikk nem értelmezhető vagy hiányos. Ilyenkor segíthet a találat környezetének, a kontextusnak a megjelenítése. Ilyenkor kattintsunk az egérrel a bal szélső cellába a sorszám mellé, majd válasszuk az Edit/Show context menüparancsot. Ekkor már értelmezhetjük a bejegyzést, és az előző sorban megtaláljuk a jelentését.

7. ÚJABB ADATBÁZIS LÉTREHOZÁSA PL. MÁS NYELVPÁRHOZ

Más nyelvpárhoz vagy témakörhöz új adatbázist a fenti 3. pont szerint lehet létrehozni és a 4. pont szerint tartalommal feltölteni.

8. ADATBÁZIS KÉSŐBBI BŐVÍTÉSE

Ha nem a kívánt adatbázis van megnyitva, vagyis nem annak a neve szerepel a program ablakának címsorában, amelyiket bővíteni szeretnéd, akkor a File/Open database (Ctrl-O) paranccsal nyisd meg az adatbázist. Ezután a 4. pontban leírtak szerint importálható a további tartalom.

9. ADATBÁZIS TISZTÍTÁSA

Az Edit/Remove duplicates from database paranccsal az ismétlődő bejegyzések törölhetők az adatbázisból.

Megjegyzés: Az Edit menüben található egy Export lehetőség TAB-delimitált TXT fájlba. Ez felhasználható arra például, hogy a különböző korábbi forrásaidból egybeömlesztett, majd duplikátumoktól megtisztított szótáradat egyetlen fájlba exportáljad.

10. VÁLTÁS AZ ADATBÁZISOK KÖZÖTT

Ha nem az az adatbázis van megnyitva a kereséshez, amelyiket használni szeretnél, vagyis nem annak a neve szerepel a program ablakának címsorában, akkor a File/Open database (Ctrl-O) paranccsal nyisd meg a kívánt adatbázist.

Gépi előfordítás hasznosítása (QTranslate)

A legtöbb fordítómemóriás program ma már valamilyen modullal támogatja a gépi előfordítás hasznosítását. Ezeknek a moduloknak a konfigurálása azonban sokszor nem egyszerű, és előfordul, hogy nem is ingyenes a használatuk.

Évek óta használom az ingyenes QTranslate programot a Wordben, memoQ-ban vagy SDL Trados programokban való fordításnál, illetve a weben való böngészés közben, amikor egy számomra ismeretlen nyelven írt szöveget szeretnék valamennyire megérteni.

Az alábbiakban bemutatom, hogyan használom a programot, és milyen beállításokat javaslok.

A programot a honlapjáról lehet letölteni. A letöltés fülön (Donwload) lehetőség van telepítést nem igénylő (pendrive-on hordozható) verzió letöltésére is.

A telepítés után a tálcán megjelenik a QTranslate program ikonja. Erre jobb egérgombbal kattintva válasszuk az Opciók lehetőséget.

Itt érdemes bejelölni, hogy a program induljon a Windows rendszerrel együtt, és a jobb olvashatóság érdekében érdemes a betűméretet megnövelni.

A bal oldali oszlopban válasszuk a Gyorsbillentyűk lehetőséget.

A saját céljaimhoz a fenti ábrán látható két billentyűkombinációt választottam. A jobb ablakrészben az egyes funkciók során a bal egérgombbal kétszer kattintva az ott korábban beállított kombináció törölhető, illetve a kívánt új billentyűkombináció lenyomásával a kombináció módosítható vagy beállítható.

A fenti beállítás lehetővé teszi, hogy miután egy szöveget bárhol kijelöltem, a Ctrl+y lenyomására egy ablakban megnézhetem a fordítását (amit pl. a vágólapra másolhatok), vagy a Ctrl+í gomb lenyomására a kijelölt szöveget a program automatikusan lecseréli a gépi fordításával (persze csak akkor, ha a szöveget szerkesztőablakban jelöltem ki).

Javaslom, hogy a tálcán levő ikonra jobb egérrel kattintva engedélyezzük az Egér módot:

Ekkor ha ezután bármilyen szöveget kijelölünk például a böngészőben, megjelenik egy rövid ideig az alábbi lebegő eszközsor, amelynek a bal szélső ikonjára kattintva kezdeményezhetjük a fordítást.

Akkor sincs gond, ha eltűnik az eszközsor, ebben az esetben a Ctrl+y billentyűkombinációval jeleníthető meg a fordítás.

Az egeret az ablak aljára mozgatva választhatunk a gépi fordítási szolgáltatások között. Tapasztalataim szerint a Google adja a legjobb eredményt, de esetleg egy másik motor az adott nyelvirányban adhat további ötleteket is. A jelen esetben az alábbi szövegváltozatokat kaptam:

Azt, hogy melyik fordítási szolgáltató változatai szerepeljenek itt, azt az Opciók ablakban a Szolgáltatások lehetőségre kattintva lehet beállítani.

A program nekem elsősorban angol nyelvre fordításnál jelent nagy segítséget, de magyar nyelvre fordításnál is segíthet (különösen az egyszerűbb szerkezetű mondatoknál), illetve egyfajta előszótározást végez, amelyet hasznosíthatok, vagy a csacsisága miatt vidámabban folytatom a munkát, mert megerősít abban, hogy még sokáig szükség lesz arra, amit nem lehet gépesíteni: a józan eszünkre.