Óriás szövegtárak és szótárak használata (TMLookup)

A Farkas András fordító által készített TMLookup nyílt forráskódú programmal kétnyelvű és többnyelvű szöveges adatbázisokban (fordítási memóriákban) és szószedetekben kereshetünk gyorsan. Ez az ingyenes eszköz olyan hatalmas memóriákban és szószedetekben is gyorsan megtalálja, amit keresünk, amelyeknek a kezelésébe a kereskedelmi fordítástámogató programoknak már beletörik a bicskájuk (sok millió bejegyzés esetén). A TMLookup több nyelvet is képes kezelni és a keresési eredményeket akár egy másodperc alatt is visszaadhatja, még akkor is, ha az adatbázis tízmillió bejegyzést tartalmaz.

A programot jól használhatjuk fordítástámogató eszközünk kiegészítésére, túl nagy méretű adatbázisaink összehangolt kereséséhez. Importálhatjuk az összes saját memóriánkat és szószedetünket, illetve a neten elérhető hatalmas memóriákat (pl. EU-s joganyag, amelyeket először többnyire át kell alakítanunk, de meg is lehet vásárolni az átalakított memóriát vagy szószedetet a program szerzőjétől).

Az alábbiakban egy 460 ezer szócikket tartalmazó angol-magyar szótár segítségével mutatom be a program telepítését és használatát. A szótárfájlt Bordács Mihály fordító készítette elő. A szótárfájl letölthető innen: http://wordfisher.com/enhualap.zip

Letölthető még egy szintén általa készített magyar-német szótár (kb. 330 ezer szócikk) innen: http://wordfisher.com/hude-base.zip és egy magyar-holland szótár is (kb. 150 ezer szócikk) innen: http://wordfisher.com/maho.zip

A szótárfájl letöltése után a TMLookup program honlapjáról, a DOWNLOAD hivatkozásra kattintva töltsd le a program legújabb verzióját.

1. TELEPÍTÉS

A letöltött ZIP-fájlban levő [TMLookup] könyvtárat pl. a D:\ meghajtóra csomagold ki. Ugyanebbe a könyvtárba csomagold ki a szótárfájlt is. Ekkor ezek a fájlok lesznek a könyvtárban:

A program ezután a d:\TMLookup\TMLookup.exe programmal indítható. A programon jobb egérgombbal kattintva, a Küldés lehetőséget választva az asztalon parancsikont is létrehozhatsz a program gyors indításához.

2. FÁJLOK ELŐKÉSZÍTÉSE

A letöltött szótárfájl már megfelelően elő van készítve, UTF-8 kódolású TAB-delimitált szövegfájl. A szövegfájlok kódolása ellenőrizhető és módosítható számos ingyenes TEXT editorral, ilyen pl. az EditPad Lite.

A TMLookup program új verziójában a honlapon szereplő .TMX és UTF-8 kódolású .TXT szövegfájlokon kívül .XLS és Trados .SDLTM fájlok is beolvashatók és kezelhetők akár egyetlen hatalmas memóriaként.

3. AZ ELSŐ ADATBÁZIS LÉTREHOZÁSA

A program elindítása után File / Create new database (Ctrl-N) parancsra megnyíló ablakban be kell írni a megfelelő FORRÁS és CÉLNYELVI kódot, pl. angol-magyar esetén en és hu.

Ezután kattints a Start gombra.

A megjelenő ablakban ki kell választani az adatbázis HELYÉT és meg kell adni a NEVÉT.

HELYKÉNT a program d:\TMLookup\ könyvtárát javaslom, mert ha ezt következetesen betartod, akkor egy pendrive-on is hordozható szótárad lesz. A NÉV megadásakor célszerű a név végére a NYELVPÁRT beilleszteni, ez megkönnyíti a későbbi azonosítást, pl. general-en-hu

Ezután kattints a Mentés gombra.

4. ADATBÁZIS FELTÖLTÉSE TARTALOMMAL

Az aktuális (megnyitott) adatbázis neve a program ablakának címsorában mindig látható. Jelen esetben: general-en-hu.db

Amikor először használod a programot, és létrehoztad az adatbázist, az adatbázis még üres. Ebbe lehet betölteni az adatokat a TMX, XLS, SDLTM vagy TXT fájlokból.

A betöltés menete:

Az Edit/Import file(s) into active database parancs és a Start gomb lenyomása után megjelenő ablakban válaszd ki az importálandó forrásfájlt. Noha több fájl is kiválasztható (ha a belső szerkezetük azonos), a biztonság kedvéért az egyenként való importálást javaslom.

Kattints a Megnyitás gombra. A beállításnál ügyelj arra, hogy az adatbázis és az importálandó fájl nyelvei és a nyelvi irány megfelelő legyen!

Kattints a Start gombra. Az importálás végén megjelenik az összesítő.

5. KERESÉS AZ ADATBÁZISBAN

Ezután már kereshetünk az adatbázisban. Keressünk rá a lekváros szóra.

Ha csak a teljes szót tartalmazó bejegyzéseket szeretnéd látni, jelöld be a Match whole words jelölőnégyzetet.

Ha szeretnéd látni, szerepel-e a bukta szó is valahol a kifejezésekben, írd be a segédmezőbe a bukta szót, és kattints a Filter (Szűrés) gombra.

Ugyanerre az eredményre vezet, ha “lekváros bukta” kifejezésre keresel, és bejelölöd az Add quotes jelölőnégyzetet. (Ha nincsenek idézőjelek, akkor minden olyan bejegyzést látunk, ahol a szócikkben bárhol előfordul a két szó, ha van idézőjel, akkor csak azokat látjuk, ahol kifejezésként egymás mellett szerepelnek. Ennyiben hasonlít a Google keresőjében végzett kereséshez.)

6. KONTEXTUS MEGJELENÍTÉSE

Előfordulhat, hogy a megjelenített szócikk nem értelmezhető vagy hiányos. Ilyenkor segíthet a találat környezetének, a kontextusnak a megjelenítése. Ilyenkor kattintsunk az egérrel a bal szélső cellába a sorszám mellé, majd válasszuk az Edit/Show context menüparancsot. Ekkor már értelmezhetjük a bejegyzést, és az előző sorban megtaláljuk a jelentését.

7. ÚJABB ADATBÁZIS LÉTREHOZÁSA PL. MÁS NYELVPÁRHOZ

Más nyelvpárhoz vagy témakörhöz új adatbázist a fenti 3. pont szerint lehet létrehozni és a 4. pont szerint tartalommal feltölteni.

8. ADATBÁZIS KÉSŐBBI BŐVÍTÉSE

Ha nem a kívánt adatbázis van megnyitva, vagyis nem annak a neve szerepel a program ablakának címsorában, amelyiket bővíteni szeretnéd, akkor a File/Open database (Ctrl-O) paranccsal nyisd meg az adatbázist. Ezután a 4. pontban leírtak szerint importálható a további tartalom.

9. ADATBÁZIS TISZTÍTÁSA

Az Edit/Remove duplicates from database paranccsal az ismétlődő bejegyzések törölhetők az adatbázisból.

Megjegyzés: Az Edit menüben található egy Export lehetőség TAB-delimitált TXT fájlba. Ez felhasználható arra például, hogy a különböző korábbi forrásaidból egybeömlesztett, majd duplikátumoktól megtisztított szótáradat egyetlen fájlba exportáljad.

10. VÁLTÁS AZ ADATBÁZISOK KÖZÖTT

Ha nem az az adatbázis van megnyitva a kereséshez, amelyiket használni szeretnél, vagyis nem annak a neve szerepel a program ablakának címsorában, akkor a File/Open database (Ctrl-O) paranccsal nyisd meg a kívánt adatbázist.

Gépi előfordítás hasznosítása (QTranslate)

A legtöbb fordítómemóriás program ma már valamilyen modullal támogatja a gépi előfordítás hasznosítását. Ezeknek a moduloknak a konfigurálása azonban sokszor nem egyszerű, és előfordul, hogy nem is ingyenes a használatuk.

Évek óta használom az ingyenes QTranslate programot a Wordben, memoQ-ban vagy SDL Trados programokban való fordításnál, illetve a weben való böngészés közben, amikor egy számomra ismeretlen nyelven írt szöveget szeretnék valamennyire megérteni.

Az alábbiakban bemutatom, hogyan használom a programot, és milyen beállításokat javaslok.

A programot a honlapjáról lehet letölteni. A letöltés fülön (Donwload) lehetőség van telepítést nem igénylő (pendrive-on hordozható) verzió letöltésére is.

A telepítés után a tálcán megjelenik a QTranslate program ikonja. Erre jobb egérgombbal kattintva válasszuk az Opciók lehetőséget.

Itt érdemes bejelölni, hogy a program induljon a Windows rendszerrel együtt, és a jobb olvashatóság érdekében érdemes a betűméretet megnövelni.

A bal oldali oszlopban válasszuk a Gyorsbillentyűk lehetőséget.

A saját céljaimhoz a fenti ábrán látható két billentyűkombinációt választottam. A jobb ablakrészben az egyes funkciók során a bal egérgombbal kétszer kattintva az ott korábban beállított kombináció törölhető, illetve a kívánt új billentyűkombináció lenyomásával a kombináció módosítható vagy beállítható.

A fenti beállítás lehetővé teszi, hogy miután egy szöveget bárhol kijelöltem, a Ctrl+y lenyomására egy ablakban megnézhetem a fordítását (amit pl. a vágólapra másolhatok), vagy a Ctrl+í gomb lenyomására a kijelölt szöveget a program automatikusan lecseréli a gépi fordításával (persze csak akkor, ha a szöveget szerkesztőablakban jelöltem ki).

Javaslom, hogy a tálcán levő ikonra jobb egérrel kattintva engedélyezzük az Egér módot:

Ekkor ha ezután bármilyen szöveget kijelölünk például a böngészőben, megjelenik egy rövid ideig az alábbi lebegő eszközsor, amelynek a bal szélső ikonjára kattintva kezdeményezhetjük a fordítást.

Akkor sincs gond, ha eltűnik az eszközsor, ebben az esetben a Ctrl+y billentyűkombinációval jeleníthető meg a fordítás.

Az egeret az ablak aljára mozgatva választhatunk a gépi fordítási szolgáltatások között. Tapasztalataim szerint a Google adja a legjobb eredményt, de esetleg egy másik motor az adott nyelvirányban adhat további ötleteket is. A jelen esetben az alábbi szövegváltozatokat kaptam:

Azt, hogy melyik fordítási szolgáltató változatai szerepeljenek itt, azt az Opciók ablakban a Szolgáltatások lehetőségre kattintva lehet beállítani.

A program nekem elsősorban angol nyelvre fordításnál jelent nagy segítséget, de magyar nyelvre fordításnál is segíthet (különösen az egyszerűbb szerkezetű mondatoknál), illetve egyfajta előszótározást végez, amelyet hasznosíthatok, vagy a csacsisága miatt vidámabban folytatom a munkát, mert megerősít abban, hogy még sokáig szükség lesz arra, amit nem lehet gépesíteni: a józan eszünkre.

 

Kell-e fordítómemóriás program, és ha igen, milyen?

Attól függ, ki milyen típusú munkákat végez, illetve a megrendelők milyen feltételeket támasztanak. Előbb-utóbb érdemes megtanulni néhány ilyen programnak a kezelését.

Függetlenül attól, hogy dolgozunk-e ilyen programmal, későbbi hasznosítás érdekében mindenképpen célszerű megőrizni és gyűjteni a forrás- és célnyelvi fájlokat.

A legelterjedtebb programok az SDL Trados Studio (EUR 700), memoQ (EUR 620), Wordfast (EUR 250), DejaVu (EUR 420) és az OmegaT (free). Több ingyenes, online (böngészőben) használható megoldás is megjelent, pl. Wordfast Anywhere vagy MateCat. Ma már sok profi fordító több ilyen programot is használ egyszerre.

Az Európai Bizottság Fordítási Főigazgatósága 2007 novemberétől 22 nyelven elérhetővé tette az EU joganyag TM-jét. Egy szintén innen letölthető programmal (TMXtract) elkészíthetjük a minket érdeklő nyelvpár memóriafájlját. Ez azonban olyan hatalmas, hogy a fordítómemóriás programok nem tudják megfelelően kezelni. Külön programmal kereshetünk benne, pl. Farkas András fordító ingyenes TMLookup programjával.

Milyen számítástechnikai ismereteket várnak el a megrendelők?

A fordítóktól elvárhatók az alábbiak:

  • E-mailek kezelésének alapos ismerete (CC, BCC címzés használata, címjegyzék használata, visszaigazolás kérése, csatolmányok küldése és fogadása, szöveg másolása a vágólapon, válasz a feladónak/mindenkinek használata). Mindig nyugtázzuk a kapott levelet, és ezt várjuk el másoktól is.
  • Csatolmányok küldése és fogadása (mentése a levelezőprogramból, az tömörített állományok kicsomagolása, tömörített állományok készítése).
  • Dokumentumok formázása (karakterek, bekezdések, felsorolások, tabulátorok formázásának ismerete, táblázatok létrehozása és kezelése, szövegdobozok kezelése). Szóközökkel soha ne pozicionáljunk.
  • Formázási stb. jelek megjelenítését kapcsoljuk be. Csak így láthatjuk, nincsenek-e a mondatok bekezdésjelekkel tördelve, nincsenek-e felesleges szóközök, nincs-e rejtett szöveg valahol.
  • Korrektúrafunkció használata a Wordben (bekapcsolása és kikapcsolása, változások elfogadása és elvetése).
  • Internetes keresés (hatékony módja, szűkítési lehetőségek).
  • Mappák létrehozása és fájlok kezelése a számítógépen.
  • Fájlok megtalálása a számítógépen.
  • Biztonság garantálása a számítógépen (vírusmentesség).
  • Rendszeres biztonsági mentés.

Milyen eszközökre van szükségem?

A munkavégzéshez megfelelő számítástechnikai háttér szükséges. Különleges hardverigényt a fordítás nem igényel, a ma kapható átlagos új gépek megfelelők, legalább Windows 7 vagy újabb operációs rendszerrel.

A szélessávú internetkapcsolat alapkövetelmény.

Ami a szoftvereket illeti, a Microsoft Office 2000 (kompatibilitási csomaggal), de inkább Office 2007 vagy újabb irodai programcsomag kell, mert a megrendelők is ezt használják. Emellett vannak hasznos shareware és freeware programok is, amelyeket érdemes használni. Néhány példa:

Translation Office 3000 (EUR 79/125/219) – munkanyilvántartás, számlázás
dtSearch Desktop (USD 199) – gyors keresés fájlokban különféle feltételek megadásával
TMLookup (Farkas András) – gyors keresés óriás TM-fájlokban
ApSIC Xbench (free vagy EUR 126 / év) – keresés terminológia-, fordítómemória-fájlokban
Everything search engine – gyors fájlkeresés a fájlnév alapján
IntelliWebSearch (free vagy EUR 25 / év) – internetes keresések gyors indítása fordítóknak
AutoHotkey – Windows makróprogram pl. a szótározás meggyorsítására
QTranslate – gyors gépi fordítás, automatikus nyelvfelismeréssel
Typing Assistant (USD 80) – prediktív gépelés

Fontos továbbá az ergonómiailag is megfelelő kényelmes szék és íróasztal.

Mire kell ügyelni a munka elvállalásakor?

Az összes fontos feltételt a munka megkezdése előtt írásban egyeztetni és tisztázni kell. Egyértelmű kell legyen a munka tárgya, mennyisége, határideje, az elszámolás alapja, az ára, a számlázás és a fizetés módja. Ez a feltétele annak, hogy ha később gond merül fel a munkával vagy a fizetéssel kapcsolatban, legyen mire hivatkozni.

A munka előzetes megtekintése nélkül fordítást, lektorálást nem szabad elvállalni (különösen nagyobb munka esetén), nem éri meg a kockázatot. Hosszabb távon napi 1500-2000 szó fordításánál többet ne vállaljunk.

Milyen árat lehet kérni?

Az ár nagyon tág határok között mozog, függ a nyelvpártól, a szövegtől, sürgősségtől. Éppen ezért nem is nagyon érdemes előre megadni (ahogyan látatlanban munkát vállalni sem). Fel kell készülni a tárgyalásra, és ki kell dolgozni előre a változatokat elszámolási egységek alapján (karakter szóközzel és anélkül, szó, 1000 szó, sor, valamint forrás- vagy célnyelv), a szóba jöhető pénznemekben

Árvariációk kiszámítása angol-magyar nyelvpárra

Elemezni kell egy nagyobb kétnyelvű korpuszt, például egy fordítómemóriát. Egy 32000 szegmenst tartalmazó angol-magyar fordítómemória tartalma:

Nyelv Szó Karakter szóközzel Karakter Sor*
Angol 438 245 2 641 593 2 233 786 48 028
Magyar 368 826 2 756 548 2 417 817 50 119

*Sor = 55 karakter szóközzel

A jobb áttekinthetőség érdekében 1000 angol szóra arányosítva:

Nyelv Szó Karakter szóközzel Karakter Sor
Angol 1000 6000 5100 110
Magyar 840 6300 5500 114

Látható, hogy nem mindegy, forrásnyelvi vagy célnyelvi alapon történik-e az elszámolás.

Innen jól látható a magyar és angol szavak átlagos hossza közötti különbség is.

1 angol szó = 6 karakter (szóközzel)

1 magyar szó = 7,5 karakter (szóközzel)

Most nézzük meg, mennyiért végezzük el ezt a munkát.

Ha a célnyelvi karakterár szóközzel 2 Ft, akkor az összeg 6300 * 2 = 12600 Ft

Ezt az összeget elosztva a táblázat értékeivel, megkapjuk az ekvivalens karakterárat:

Nyelv Szó Karakter szóközzel Karakter Sor
Angol 12,60 2,10 2,50 114,50
Magyar 15,00 2,00 2,30 110,50

Ugyanez eurócentben (1 EUR = 311 HUF, 1 HUF = 0,0032 EUR):

Nyelv Szó Karakter szóközzel Karakter Sor
Angol 4,10
Magyar

Ugyanez dollárcentben (1 USD = 282 HUF, 1 HUF = 0,0035 USD):

Nyelv Szó Karakter szóközzel Karakter Sor
Angol 4,50
Magyar

Ugyanez angol fontban 1000 egységre (1 GBP = 402 HUF, 1 HUF = 0,0025 GBP):

Nyelv Szó Karakter szóközzel Karakter Sor
Angol 31
Magyar

Összefoglalás (forrásnyelvi alapon):

HUF / karakter USD / szó EUR / szó GBP / 1000 szó
2 0,05 0,04 31
3 0,07 0,06 47
4 0,09 0,08 62

Ennek alapján rögtön ajánlatot adhatunk arra, hogy egy adott munkát mennyiért vállalunk el, illetve arra, hogy a felajánlott árat elfogadjuk-e.

 

Hogyan lehet megrendelőket, munkát találni?

Készítsünk egy magunkat kedvezően bemutató, tömör és hibátlan önéletrajzot, forrás- és célnyelven is, és esetleg állítsunk össze egy referenciacsomagot.

Össze kell gyűjteni fordítóirodák, kiadók, közvetlen megrendelőként szóba jöhető cégek címeit, akiknél jelentkezhetünk. Jelentkezzünk fordítói listák, portálok, fordítóirodák online adatbázisaiba.

Számítani kell arra, hogy a több száz helyre beadott jelentkezésünkre csak kevesen válaszolnak, és még kevesebből lesz munka. Csak olyasmit szabad elvállalni, amit meg is tudunk csinálni. Nyilván kell tartani a jelentkezéseinket, és időnként visszatérni, aktualizálni azokat (ahogyan nő a tapasztalatunk, kínálatunk). A megrendelői kör építése folyamatos feladat.

Meg lehet-e élni a fordításból?

Az élet azt bizonyítja, hogy sokaknak sikerül.

A fordítók tipikusan önfoglalkoztató vagy szabadfoglalkozású formában dolgoznak. Erre nem mindenki alkalmas, önbizalmat, önállóságot, szervezőkészséget, rendszeres adminisztrációs feladatok elvégzését igényli. Nincs garantált megrendelés, havi fizetés, szabadság, betegállomány. Mindezt el kell tudni viselni.

Nagyon fontos az anyagi tartalék megléte, legalább fél évre, de inkább egy évre – a pályakezdéskor és utána is –, ha nem akarja űzött vadként leélni az életét, rákényszerülve arra, hogy bármilyen munkát elvállaljon, mert szorítja a szükség…

A siker titka

Az internetnek köszönhetően kialakult virtuális fordítói közösségek (pl. mfefo) módot adnak a fordítással kapcsolatos általános (nyelvfüggetlen) kérdések felvetésére és megvitatására is. Az egyik ilyen kérdés, hogy a fordítói pályán mi a siker titka. Sokszor kerül szóba a fordítói fórumokon a nyomott árak kérdése, valamint az ár és a minőség közötti összefüggések. A mfefón egy ilyen eszmecsere alkalmával néhány fordító megfogalmazta a hozzáállás fontosságát, amelyet én is kulcsfontosságúnak tartok:

Az én mottóm: „Ha dolgozom, akkor a tőlem telhető legjobb teljesítményt nyújtom vagy el sem kezdem a munkát.” Ez független a pénztől és a többi körülménytől, ez magammal szembeni követelmény. [Sepke Mária]

Ugyanez másként:

A saját névjegyed a jó munka. Ha keveset kapsz érte, az pedig a piaci helyzet. [Samu János]

Mikor jó egy fordítás, és mit kell tennünk annak érdekében, hogy jó legyen?

Tömören fogalmazva: akkor jó, ha megfelel a funkciójának. Ehhez természetesen tudnunk kell, hogy mi a funkciója (ki a megrendelő, ki a befogadó, és mit akar elérni a szöveg). A fordítónak ezt mindig tisztáznia kell a fordítás előtt. Mivel a fordítás során a szöveg eredeti szerzőjének a szerepét játssza el egy másik nyelvi környezetben, fontos, hogy mindig értse is, amit leír (egy határig, természetesen, hiszen nem kell tudósnak lennie ahhoz, hogy tudományos szöveget írjon), vagy másként megfogalmazva, soha ne írjon le olyat, amit maga nem ért. Ennek egyik gyakorlati folyománya, hogy a teljes szöveget a fordítás előtt át kell olvasnia, hogy egyben lássa az egészet (és már a fordítási folyamat elején kiszűrje a problémákat), és természetesen a fordítás után is el kell olvasnia a szöveget (önellenőrzés).

Az értelmes szöveg előállítása mellett fontos, hogy a szöveg hatásos is legyen. Ezt csak akkor érheti el a fordító, ha tisztában van azzal, hogy mitől hatásos egy szöveg (ehhez sok és sokféle szöveget kell olvasnia, mindhalálig). A szövegek előállításakor kreatívnak és játékosnak kell lennie, ugyanazt sokféleképp meg kell tudnia fogalmazni, hogy fordítás közben mindig legyen választási lehetősége a különféle megfogalmazások közül. Másként mondva: legyen némi írói vénája, tehetsége.

A tehetség mellett a kivitelezésben szükség van igényességre, lelkiismeretességre: a terminológia legyen szakmailag helyes és konzisztens, a helyesírás legyen hibátlan.

Mivel a fordítás ma már szinte kizárólag számítógép segítségével történik, a siker feltétele az is, hogy a fordító ismerje az eszközt, amivel dolgozik, annak lehetőségeit, és kezelni tudja az óhatatlanul felmerülő technikai problémákat.

A siker feltétele tehát a tehetség, az igényesség és a kellő számítástechnikai ismeret megléte. Aki birtokában van e három feltételnek, az nyugodtan nevezheti magát profinak. Ehhez még annyit tennék hozzá, hogy nem elég profinak lenni, annak is kell látszani, vagyis profiként kell megjelennie a piacon (pl. saját honlap, kommunikáció módja a fórumokon a kollégákkal, illetve a munkák során a megrendelőkkel).