Tato prezentace | obsahuje anglické texty, jejich strojové překlady a české komentáře. V textu nejsou použity žádné lidské překlady. | |
Můj první engin (people) z tématických TMX vytvořených v roce 2015 z databáze Eur-lex
byl vytvořen z nejmenší TMX.
V přehledu jsou uvedeny celkové počty slov zdrojového a cílového jazyka. Jako anglická slova je vykázáno 314 160 slov. | ||
Dnes se zaměřím na počty jedinečných slov. Engin obsahuje soubory 1-gramových (jednoslovních) seznamů zdrojových a cílových slov včetně číslic, interpunkčních znamének a jiných znaků.Počet "jedinečných anglických slov" je 9 354 slov. Celkový počet jedinečných "anglických slov" obsahuje i slova v jiných jazycích, které se používají v Eur-lexu. Engin "People" má na koci souboru bulharská slova | ||
Tématické třídění slov 29 popisovačů zdrojových slov enginu "Competition" |
Teprve na 29. řádku seznamu se vyskytuje kategorie "competition". Kontrola státní pomoci ve "starých státech EU" je zastoupena četněji. |
|
Pro testování překladu
použiji Slate Desktop a 3 enginy:
| ||
Překlad 3 souborů
|
Protože mě zajímají slova, která nejsou ve slovníku |