IATE |
InterActive Terminology for Europe; Roste databáze, roste? Předchozí prezentace o IATE, JEX a Eurovocuhttps://www.proz.com/forum/czech/283811.html |
|
IATE a Wizard |
Jednotlivá "státní-národní-jazyková" oddělení DGT zajišťují doplňování databáze IATE.
DGT má k dispozici pro vytváření projektu pro OmegaT aplikaci Wizard. Aplikace k souborům přidaným do projektu může extrahovat terminologii z IATE, (je to jedna z možností: TagWipe, IATE, SECEM a SDLxlif). Wizard pro externí překladatele tuto funkci zobrazuje. |
|
Odkaz na prezentaci z 5.4.2019 | Vytvořit projekt a nastavit MT - 02 | |
Extract Kdokoli si může stáhnout databázi ve formátu TBX.Celou nebo vybranou část |
Jazyky: CS, EN, FR, PT; Extract ANY = existuje položka alespoň pro jeden jazyk |
|
Co lze stáhnout? |
Čeština má druhý nejmenší počet položek. Méně má chorvatština. Chorvatsko vstoupilo do EU v roce 2013, Česko v roce 2004. Vývoj jsem sledoval https://www.proz.com/forum/czech/283811.html. |
|
Dlouho měla čeština více položek než bulharština. Nyní má více položek bulharština. |
https://www.karaoketexty.cz/texty-pisni/j-a-r/bulhari-39451
A doufaj že dílko se podaří a když ne no tak zas budou A doufaj že dílko se podaří a když ne no tak zas budou Bulhaři |
|
Otevření TBX |
Vícejazyčný soubor TBX je možno otevřít v programu Goldpan.
V ukázce jsou extrahované 4 jazyky. Pokud nejsou položky ve všech jazycích,
nejsou položky ve správných sloupcích jazyka. Položky lze doplňovat a upravovat. IATE rozlišuje plný tvar výraz anebo zkratku. Překladatelé nedodržují tuto úmluvu. Jeden jazyk obsahuje zkratku (akronym) a jiný jazyk plný tvar. |
|
Konverze formátu | Můj standardní potup byl: konvertovat TBX na TMX v nástroji Xbench. Xbench zpracovává pouze dva jazyky: jeden zdrojový a jeden cílový. TMX se dvěma jazyky jsem naiportoval do programu TMLookup a z TMX jsem vyexportoval textový soubor | |
Využití needitovaných dat |
Získáme TBX výběrem Extract ALL a dvou jazyků. Vytvoříme textový soubor,
který můžeme využít přímo nebo naiportovat do CAT a překladačů.
Jazyky s velkým počtem položek má smysl třídit podrobněji. Jazyky s malým počtem položek stačí extrahovat podle tříd nebo vůbec netřídit. |
|
JEX TBX Tools | Netestoval jsem verzi 2019-01-01.V0.2 (A Python class for Terminology Extraction and Management, EN, ES) |