First/první Previous/předcházející Home Next/další Last/poslední

      IATE 10/2019
 01  Databáze IATE v říjnu 2019





IATE  

InterActive Terminology for Europe; Roste databáze, roste?

Předchozí prezentace o IATE, JEX a Eurovocu

https://www.proz.com/forum/czech/283811.html

Adventní verze TMLookup

Smysl a údržba překladových pamětí - 01

IATE - update 2018-08

Analýza programem JEX

Projekt PT-EN a folha + IATE TBX




IATE a Wizard   Jednotlivá "státní-národní-jazyková" oddělení DGT zajišťují doplňování databáze IATE.
DGT má k dispozici pro vytváření projektu pro OmegaT aplikaci Wizard.

Aplikace k souborům přidaným do projektu může extrahovat terminologii z IATE, (je to jedna z možností: TagWipe, IATE, SECEM a SDLxlif).

Wizard pro externí překladatele tuto funkci zobrazuje.




Odkaz na prezentaci z 5.4.2019   Vytvořit projekt a nastavit MT - 02



Extract

Kdokoli si může stáhnout databázi ve formátu TBX.
Celou nebo vybranou část
 

Jazyky: CS, EN, FR, PT; Extract ANY = existuje položka alespoň pro jeden jazyk




Co lze stáhnout?  

Čeština má druhý nejmenší počet položek. Méně má chorvatština. Chorvatsko vstoupilo do EU v roce 2013, Česko v roce 2004.

Vývoj jsem sledoval https://www.proz.com/forum/czech/283811.html.




Dlouho měla čeština více položek než bulharština.

Nyní má více položek bulharština.
  https://www.karaoketexty.cz/texty-pisni/j-a-r/bulhari-39451

A doufaj že dílko se podaří
a když ne no tak zas budou

A doufaj že dílko se podaří
a když ne no tak zas budou Bulhaři



Otevření TBX   Vícejazyčný soubor TBX je možno otevřít v programu Goldpan. V ukázce jsou extrahované 4 jazyky. Pokud nejsou položky ve všech jazycích, nejsou položky ve správných sloupcích jazyka.
Položky lze doplňovat a upravovat.

IATE rozlišuje plný tvar výraz anebo zkratku. Překladatelé nedodržují tuto úmluvu. Jeden jazyk obsahuje zkratku (akronym) a jiný jazyk plný tvar.



Konverze formátu   Můj standardní potup byl: konvertovat TBX na TMX v nástroji Xbench. Xbench zpracovává pouze dva jazyky: jeden zdrojový a jeden cílový. TMX se dvěma jazyky jsem naiportoval do programu TMLookup a z TMX jsem vyexportoval textový soubor



Využití needitovaných dat   Získáme TBX výběrem Extract ALL a dvou jazyků. Vytvoříme textový soubor, který můžeme využít přímo nebo naiportovat do CAT a překladačů.

Jazyky s velkým počtem položek má smysl třídit podrobněji. Jazyky s malým počtem položek stačí extrahovat podle tříd nebo vůbec netřídit.



JEX

TBX Tools
  Netestoval jsem verzi 2019-01-01.V0.2 (A Python class for Terminology Extraction and Management, EN, ES)

https://sourceforge.net/projects/tbxtools/postdownload


First/první Previous/předcházející Články / Articles Next/další Last/poslední

Copyright Ing. Milan Čondák 30.10.2019