First/první Previous/předcházející Home Next/další Last/poslední

Tesseract-OCR
 05  Text a jeho strojový překlad




Zvolil jsem postup s textovým souborem  

Soubory jsem spojil do jednoho souboru v programu Balabolka.




Na jednotlivých stránkách byly názvy ˇčlánku "Questions of democracy" a jméno autora.
Nahradil jsem je dvěma otazníky.
 



Smazal jsem dva otazníku a čísla stránek. Odstranil jsem prázdné řádky.  



Na začátek textu jsem vrátil název a jméno autora.  



Dodatečně jsem zjistil, že dvojtečka je v eTranslation značka pro konec segmentu.  



Strojový překlad textu do formátu TMX

pomocí služby eTranslation.
 

First/první Previous/předcházející Články / Articles Next/další Last/poslední

Copyright Ing. Milan Čondák 14.03.2021