Český dokument tradoc_153234_cs.PDF Text je dvou sloupcích, což komplikuje přiřazení textů, které jsou v různých jazycích. | ||
Anglický dokument tradoc_153121_en.PDF | a všechny ostatní PDF soubory jsem zkonvertoval do souborů TXT. | |
OmegaT Do složky source-archiv jsem umístil soubory, které neobsahují anglický text nebo nešly otevřít.(Pouze pro jeden anglický soubor PDF, který není součástí propagačních materiálů, jsem musel použít OCR.) PDF dokument Na cestě k obchodní dohodě mezi EU a USA - Aby obchod fungoval ve váš prospěch byl přeložen do všech oficiálních jazyků EU. |
||
Vytvoření TMX Vzhledem ke struktuře textu (formátování v PDF) jsem přiřazoval postupně několik částí dokumentů a potom jsem vytvořil EN-CS TMX. | ||
Překlad anglických PDF v OmegaT Konverze PDF do TXT | OmegaT umí číst text uložený v PDF. OmegaT při vytváření překladu uloží do složky target přeložené texty. Když nejsou texty přeložené, uloží extrahované anglické texty v kódování ANSI (mám české Windows a nastavený překlad do češtiny). | |
Konverze PDF do TXT | Balobolka umožňuje hromadný výpis z souborů PDF do textových souborů v kódování UTF-8. Viz dále. | |