02

				Wordfast Server Pro

02	Výzva Velmi velkých překladových pamětí (VLTM-esek)

Stručná historie

Překladové nástrojů první generace jsou v podstatě desktopové aplikace. Motor překladové paměti je integrován v překladovém nástroji a TM je umístěna na pevném disku lokálního počítače. Pouze jeden překladatel - uživatel překladového nástroje - v dané době přistupuje k TM. Řádově mají desktopové nástroje v jedné TM jeden milion PJ (desktopové TM-esky mohou teoreticky mít několik milionů PJ. Nicméně nad milion PJ výkon vážně klesá). Jeden překladatel, který pracuje 20 let, zhruba vyrobí milion PJ.

S rozšířením CAT nástrojů a paradigmem TM, začaly velké organizace tlačit, aby se již používaly TM-esky organizované kolem architektury klient-server s klasickými databázemi. Architektura klient-server představuje vysokou úroveň složitosti, výměnou za přesvědčivé výhody: škálovatelnost, centralizaci, ovládání, bezpečnost, hustotu pokrytí.

WFS nabízí plně rozvinutou klient-server architekturu.

Pod kapotou

WFS integruje svůj vlastní databázový stroj. Jiná řešení spoléhají na standardní databázové systémy, jako jsou Oracle ™, nebo SQL. Standardní databázový systém může znít uklidňujícně pro vedení, má ale zásadní nedostatky. První je, že databáze jsou postaveny na standardních postupech jako řízení podniku. Nejsou optimalizovány pro jazykové účely. Standardní databázový systém je vhodný pro skladování TM-esek, ale jeho výsledky jsou slabé, pokud jde o jejich využívání. Když motor TM vyhledává shodu ve velké TM, potřebuje přistoupit a pak prohlédnout tisíce kandidujících PJ před přijetím svého konečného výběru - to vše ve zlomku vteřiny. Není divu, že vyhledávací motory, se potýkají se stejnými úkoly (zjišťování přibližných překladů v obrovských masách textu, lingvistických datech), používají svoje vlastní proprietární databáze a systém indexování. Jazykové motory nemohou použít standardní prostředky databáze.

Když si koupíte TM server, který se opírá o standardní databázový stroj, vlastně platíte rukou za licence databázového systému, a nohou za těžkopádný motor porovnávající TM, který acrobaticky spojuje databázový systém pro podnikání s překladatelskými potřebami.

Aplikační tým Wordfastu se rozhodl vybudovat konzistentní jazykový databázový stroj od základu. Klíčové komponenty ve WFS jsou odborně naprogramovány ve strojovém kódu (assembleru) pro bezkonkurenční rychlost. Multi-threading je postaven na velmi nízké úrovni, aby se využily mnohoprocesové architektury. Formát databáze je tabulátorem oddělený textový soubor, což je pravděpodobně nejkompaktnější a nespolehlivější ze všech formátů.

Vaše výhody

WFS nabízí pravou, nekompromisní škálovatelnost. Konkurenční TM servery nabízejí VLTM-esky až do 15 milionů PJ na jednu TM. Nad tato čísla se jejich výkon stáčí dolů. Budou propagovat větší, nebo dokonce neomezenou velikost TM, ale to je skladování - kdokoli může skladovat cokoli. Nedovolte jim zastírat problémy. My hovoříme o vyúžívání TM, vyjádřeno jak dlouho překladatel čeká mezi dvěma segmenty. S konkurenčními TM servery, které mají více než 15 milionů PJ v jedné TM, vzdálení překladatelé tráví celé dny sledováním přesýpacích hodin.

WFS nabízí VLTM-esky, které využívají až miliardu PJ bez znatelného zpomalení. WFS může běžet až s 1.000 TM-eskami současně. Jediným limitem je vlastně kapacita pevného disku. Ale WFS servery mohou být zřetězeny a otevírají opravdu neomezenou škálovatelnost.

Správa VLTM-esek

Aplikační tým VLTM Wordfastu skutečně zahájil veřejný projekt VLTM, který již existoval dva roky, než jsme začali nabízet VLTM servery pro soukromé, firemní použití (jiní prodávají jejich řešení, kdy se je inženýři teprve pokoušejí vybudovat). Tak seriózně dodáváme software.

Spuštění programu VLTM pro veřejnost: jaká poučení by mohla posloužit firemnímu světu

Ve veřejném nastavení VLTM je zásadní rozlišení mezi veřejnými a soukromými PJ. Měli jsme na výběr, vytvořit VLTM jen pro čtení, a naplněnou materiálem z veřejných zdrojů, aby celý její obsah byl veřejný, a tak projekt VLTM fungoval téměř rok. Bylo nám řečeno, že nápad byl fantastický, ale že pokud by překladatelé také mohli zapisovat svoje vlastní PJ do VLTM, mohli by vytvářet pracovní skupiny a spojit své překladatelské jednotky přes web. Teď byla jediným zásadní bodem důvěrnost: jednotliví překladatelé / skupiny překladatelů, chtěli, aby jejich překladové jednotky zůstaly důvěrné, tedy neviditelné neoprávněným členům široké veřejnosti.

To je důvod, proč jsme vytvořili režim ID pracovní skupiny. ID pracovní skupiny je dlouhé, bezpečné a jedinečné heslo, generované samotným serverem. Každý jednotlivý překladatel, nebo skupina překladatelů, kteří používají takové heslo, mohou zapisovat do VLTM. Jejich PJ jsou zaznamenány ve veřejné VLTM, ale jsou označeny s tímto heslem, a mohou být čteny nebo získány pouze překladateli, kteří jsou vybaveni stejným heslem (GroupID).

Jinými slovy, překladatelé připojení k veřejné VLTM získávají návrhy z obou částí, z veřejné části VLTM (v režimu jen ke čtení), která je velká, ale ne příliš relevantní, kromě své vlastní soukromé části VLTM, která je malá, ale relevantní, a v režimu číst-psát. Mohou samozřejmě zvolit, že budou mít přednost "soukromé" shody nad "veřejnými" shodami, a obecně řečeno, vyladěné upřednostňování. Další informace na toto téma si můžete přečíst z http://www.wordfast.net/?whichpage=jobs .

Když je WFS prodáván pro soukromé firemní použití, integruje systém Workgroup ID, který může být použit, nebo ignorován, v závislosti na firemní politice. Systém Workgroup ID přichází navíc ke klasickým atributům PJ, což umožňuje jemné řízení zdrojů PJ za klienta, číslo zakázky, předmět, oddělení, nebo libovolnou kategorii, kterou chce správce realizovat. To vše je nastaveno na klientské (v překladovém nástroji) straně.

Ing. Milan Čondák www.condak.net