Lingea Translator

Jak funguje frázový překladač?

Jedná se o přístup, který je založený na velkých korpusech paralelních i jednojazyčných dat a na matematických vzorcích. Označuje se také jako statistický strojový překlad. Překlady vět jsou vytvářeny skládáním z překladů frází nalezených ve zdrojové větě. Fráze je sekvence slov, která se vyskytla v trénovacích datech, a pro kterou známe sekvenci slov, která je jejím překladem. Výběr a uspořádání překladů frází v přeložené větě jsou ovlivněny několika statistickými modely, které modelují zejména pravděpodobnost, že zdrojová fráze bude přeložena konkrétním způsobem a pravděpodobnost, že se v daném kontextu v přeložené větě bude vyskytovat právě daný text překladu fráze. Vzhledem k tomu, že některá slova jsou víceznačná (mají více významů a v různých kontextech se překládají jinak), u jiných nalezneme ustálená slovní spojení nebo fráze, tak čím více dvojjazyčných textů máme k dispozici, tím větší je pravděpodobnost, že přeložený text bude správně.

Jak funguje neuronový překladač?

Text ve zdrojovém jazyce se rozdělí na věty, věty se rozdělí na slova, slova se rozdělí na podslova. Posloupnosti podslov odpovídající jednotlivým větám se dají na vstup neuronové sítě, která z nich vytvoří reprezentaci celé věty, kterou následně převede na posloupnost podslov v cílovém jazyce. Podslova se spojí do slov, slova do vět, a ty se spojí do přeloženého textu. Alternativně mohou během tohoto postupu probíhat ještě další kroky, jejichž účelem může být například zachování formátování v cílovém dokumentu.

Co je neuronová síť?

Jedná se o jeden z výpočetních modelů, které se používají v umělé inteligenci. Neuron je výpočetní jednotka, která má velké množství vstupů a jeden výstup, který může být zase vstupem mnoha dalších neuronů. Neuronová síť je pak tvořena skupinou těchto umělých neuronů, které jsou mezi sebou navzájem propojeny obrovským množstvím spojení výstupů a vstupů.
Neuronovou síť lze předkládáním vstupů a k nim požadovaných výstupů naučit obecný vztah mezi vstupy a výstupy. Naučená neuronová síť je pak použitelná k odhadování správných výstupů i pro vstupy, které nebyly při trénování použity. Neuronový překladač se na velkém množství paralelního textu (text v jednom jazyce a jeho překlad do druhého jazyka) učí, jak přeložit zadaný text, aby co nejlépe odpovídal tréninkovým datům (paralelnímu textu použitému pro učení).

K čemu je dobrá grafická karta?

Grafické karty se v překladu používají pro výpočty neuronových sítí. Využívá se zde toho, že v neuronové síti lze velké množství výpočtů dělat paralelně, a tak výkonné grafické karty mohou v této činnosti dosahovat výkonu srovnatelného s desítkami procesorů. Díky grafickým kartám jsou tedy neuronové překladače mnohokrát rychlejší, než by byly bez nich, což se projevuje zejména ve zrychlení odezvy, schopnosti přeložit za stejnou dobu více textu, a při daném výkonu v úsporách za hardware.

Jaké jsou výhody vašeho řešení oproti konkurenci?

Lingea Translator nabízí oproti jiným dostupným překladačům tyto výhody:

  • Pro dosažení lepších výsledků využíváme vlastních jazykových dat a technologií: paralelní i jednojazyčné korpusy, slovníky, další data a morfologické a jiné nástroje
  • Překladače mohou běžet na (off-line) serveru přímo u zákazníka – zajistí se tak bezpečnost citlivých dat - data kvůli překladu nejsou svěřena nikomu jinému.
  • Malé jazyky používané ve střední Evropě jsou pro nás stejně důležité jako jazyky, kterými mluví stovky miliónů lidí, proto i jim věnujeme maximální pozornost a úsilí, zatímco například Google řeší primárně jazyky západoevropské a asijské.
  • Umožňujeme natrénování překladače na určitou doménu (automotive, strojírenství, bankovnictví, farmacie atd.) – takto specializovaný překladač většinou dosahuje výrazně lepších výsledků než překladač obecný.
  • Při překladu dokážeme zajistit zachování formátování původního dokumentu. Překlad tak může mít stejné formátování (nadpisy, odstavce, slova tučným písmem nebo kurzívou, odkazy apod.), jako původní text, jen je v jiném jazyce. Podporu různých formátů lze nastavit. Je například možné v XML dokumentu překládat jen určité části a jiné nechat beze změn, případně na různé části dokumentů použít různé překladače.
  • Můžeme kombinovat překladače se slovníkem nebo dalšími jazykovými nástroji – například před překladem do textu automaticky doplnit chybějící diakritiku (relevantní například pro maily a diskuse), pak text přeložit, a při čtení kliknutím vyhledávat slova ve slovníku.

Co se stane, když překladač něco přeloží špatně?

Překladač nikdy nemůže přeložit vše dobře z jednoho velmi prozaického důvodu, a sice že vstupní věta není jednoznačná. V každém jazyku jsou víceznačnosti, spousta vět předpokládá určitou znalost kontextu, buď z předchozího odstavce, nebo článku anebo jednoduše z všeobecných znalostí. Může docházet k záměně podmětu a předmětu, aktiva a pasiva, špatnému pochopení struktury věty nebo špatnému pochopení významu konkrétního slova. Řadu vět je obtížné správně pochopit a přeložit i pro zkušeného člověka ovládajícího zdrojový i cílový jazyk, protože zdrojová věta nemusí vždy obsahovat všechny informace potřebné pro správný překlad. Většinu vět je možné přeložit několika různými způsoby a všechny jsou správné, jen jsou některé například méně vhodné v daném kontextu nebo méně vhodné stylisticky. Překladač není náhradou za soudního překladatele. Překladač je nástroj plnící nějaký konkrétní úkol, pro který je připraven. Například může usnadnit práci lidskému překladateli (kterému ušetří čas) nebo umožnit člověku neznalému zdrojového jazyka zjistit nějakou informaci z textu. Pro tento účel se velmi hodí integrovaný slovník pro kontrolu správnosti důležitých částí překladu uživatelem. Uživatel bez znalosti zdrojového jazyka je při využití překladače a slovníku schopen si z textu s přiměřenou jistotou rychle zjistit potřebnou informaci bez zadávání práce překladateli a čekání na překlad.

Je možnost off-line nasazení?

Pokud pracujete s citlivými daty (například s maily od klientů nebo s jejich dokumenty), určitě řešíte jejich zabezpečení, a kopírování důvěrných textů do on-line překladačů je pravděpodobně nepřípustné. Pro tento případ umožňujeme nasazení překladačů přímo do infrastruktury zákazníka (off-line) – citlivá data tak nikdy neopustí vaši síť. Toto řešení ovšem vyžaduje další investici do překladového serveru. Hardwarové nároky se liší podle nasazených technologií, překladových směrů (z jakého do jakého jazyka se překládá), a požadované rychlosti překladu. Orientačně lze říci, že ceny použitelného hardwaru začínají kolem 20 tisíc korun, nicméně jsou velmi závislé na nasazených technologiích, požadované rychlosti překladu a předpokládané zátěži, a mohou se vyšplhat i na několikanásobek této částky. Konfiguraci proto upřesníme na základě další diskuse, výrazně se liší podle toho, zda zvolíte tradiční řešení statistického překladu, které je náročné zejména na paměť, nebo použijete neuronový překlad, který není tak náročný na paměť, ale vyžaduje výkonné grafické karty.

Jak se neuronový překladač dá „natrénovat“?

Vhodnou volbou trénovacích dat a jejich použití v různých fázích trénování dokážeme připravit překladače na míru určité problematice. Takto se postupovalo například pro oblast veřejného zdraví v EU projektu HimL nebo pro překlad textů z oblasti turistického ruchu pro interní lokalizace turistických průvodců. Tímto způsobem je možné připravit kvalitnější překladače, které dávají v dané tematické a stylové oblasti (tzv. doméně) lepší výstup než překladače obecné (nespecializované) a lépe zachovávají sémantickou přesnost. Kvalita výsledku závisí na složitosti domény a množství doménově specifických dat, která bylo možné použít. Nejužitečnější jsou tzv. paralelní data, tedy originální texty spolu s jejich překlady. Velmi užitečné jsou ale i doménově specifické texty v cílovém jazyce a využít lze i texty v jazyce zdrojovém. U všech tří typů dat platí, že čím více, tím lépe. Užitečné jsou také na doménu specializované glosáře, kde je ale důležitější kvalita než množství dat. Kvalita výsledného překladače tedy bývá dosti závislá na možnostech a ochotě klienta poskytnout (samozřejmě na základě smlouvy) data vhodná pro trénování těchto specifických modelů, nebo alespoň jejich popis, který lze následně využít pro získání dat z jiných zdrojů.

Je slovník, který se dá přidat, výkladový nebo překladový?

Přestože překladače využívající neuronové sítě zaznamenaly výrazný posun v kvalitě překladu, ještě to neznamená, že je překlad vždy věcně správný. Jazyky obsahují velké množství nejednoznačností, idiomů, odborných výrazů i běžných ustálených spojení a vy si nemusíte být jisti, jestli použitý překlad je skutečně správný. Naproti tomu překladové slovníky stále vytvářejí lidé, lingvisté a zkušení překladatelé, takže všechny uvedené překlady jsou zaručeně správně a stačí si vybrat ten, který je vhodný v daném kontextu. Pokud si tedy chcete ověřit správnost nebo opravit výsledek z překladače, můžete si zobrazit plné slovníkové heslo ze zdrojového textu nebo z překladu (lze obojí) v překladovém nebo výkladovém (opět lze obojí) slovníku, který může být součástí uživatelského rozhraní překladače.

Lexicon 7

Proč jsou slovníky Lingea nejoblíbenějšími elektronickými slovníky na trhu?

Většina zákazníků, kteří se dosud se slovníky Lingea Lexicon nesetkali, případně dosud používali jen volně dostupné slovníky na internetu, si elektronický slovník představuje jen jako knížku na obrazovce, v horším případě jako dva sloupce ve tvaru heslo – překlad. Slovníky Lingea Lexicon ale nabízejí mnohem více a jejich použití je tak snadné, vyhledávání hesel tak rychlé a kvalita dat tak výrazně převyšující ostatní produkty, že nový zákazník po jejich nainstalování už nemá žádný důvod jiný produkt používat. Ke klíčovým vlastnostem všech našich produktů patří:

  • zobrazení hesel: Lexicon zobrazuje hesla velmi přehledně, nový význam či příklad vždy na novém řádku. Barevně i typem písma jsou rozlišeny: heslové slovo, jeho výslovnost, slovní druh, nepravidelné tvary, překlady, příklady, upřesňující poznámky či slovesné vazby. Při poklepu na jakékoli slovo se zobrazí jeho zpětný překlad.
  • příbuzná slova: Velmi praktickou vlastností Lexiconu je nabídka slov, která mají k zobrazenému heslu nějaký vztah. S jejich pomocí můžete najít nejvhodnější překlad nebo si dále rozšiřovat slovní zásobu. Ve slovnících se můžete setkat s těmito skupinami: synonyma, antonyma, předpony, přípony, frázová slovesa, kmeny slova, slovní spojení, tematické skupiny, vlastní temata.
  • tvaroslovné hledání: Slovo můžete zadat nebo vložit z jiné aplikace přesně v tom tvaru, jak bylo napsáno (bez ohledu na jeho pád, číslo, čas nebo způsob). Např. v anglickém slovníku ke tvaru broken najde break, k německému ist zobrazí sein, k francouzskému parlions vyhledá heslo parler. To oceníte zejména při práci s internetem nebo čtení pošty.
  • fulltextové hledání: Kromě jednotlivých hesel můžete snadno hledat i celá slovní spojení. Takže můžete zadávat přímo např. break in, ve srovnání s, nehledě na, vzít roha apod., Lexicon vyhledá odpovídající hesla nebo příklady.
  • učení a zkoušení: Slovíčka v tématech se můžete i učit tím, že si dané téma přehráváte určitým tempem v přirozeném nebo náhodném pořadí, nebo vás program ze zvolených okruhů vyzkouší. Můžete si také sami vytvářet další témata.

Na kolik počítačů je možné slovník nainstalovat?

V rámci jedné licence může mít každý uživatel slovník současně nainstalovaný na dvou počítačích (např. kombinace pevný počítač a notebook). Licence je samozřejmě přenositelná na nový nebo přeinstalovaný počítač.

Co znamená funkce mouse-over?

Lexicon 7 si můžete jednoduše přepnout na malé okno, které zůstává nad všemi ostatními aplikacemi a začne pracovat v režimu mouse-over. To znamená, že se v okně automaticky zobrazí překlad slova nacházejícího se pod kurzorem. Funguje v aplikacích MS Office, Google Chrome, Mozilla Firefox nebo Adobe Reader.

Jak zvolit správný překlad?

Heslo může mít více významů a každý z nich se dá přeložit více způsoby. K tomu vám slouží právě kontextové poznámky, které na české straně uvozují každý význam hesla. Další kontexty a upřesnění je možné najít mezi překlady a slouží k rozlišení jemnějších nuancí.

Můžu vyhledat heslo, když nevím, jak se správně píše?

Ano, pokud jste slyšeli neznámé heslo a nevíte, jak se správně píše, zkuste ho zadat tak, jak ho slyšíte, při zapnuté volbě „Fonetické hledání“. Funguje v angličtině a francouzštině.

Jak správně použít slovo ve větě?

Všeobecné slovníky jsou bohaté na užitečná slovní spojení, idiomy nebo příklady užití. Najdete je přímo v heslech u jednotlivých významů a také v okně náhledu fulltextu, kde se zobrazí výskyty slova u jiných hesel, případně na opačné straně slovníku.

Jak vyhledat hesla, která je možné říct jinak?

Opakuje se Vám v textu stále stejné slovo? Pak věnujte pozornost odkazům, které najdete v levém dolním okně Lexiconu a vyberte část Synonyma.

Je součástí slovníku přehled gramatiky?

Ano, součástí všech všeobecných slovníků je stručný přehled gramatiky, u anglických titulů navíc s podrobným srovnáním britské a americké angličtiny. V gramatice je možné se snadno orientovat podle stromové struktury, nebo rychle najít požadovanou kapitolu zadáním klíčového slova.

On-line slovníky

Je lepší slovník, nebo překladač?

Na rozdíl od překladačů, jako je Google Translate nebo Bing Translator, přináší tento slovníkový portál skutečné slovníky, na jejichž vývoji pracovali profesionální lingvisté. Překladače obvykle nabízí jen jeden překlad zadaného slova; pokud jich uvádí více, chybí u nich další upřesnění konkrétního významu. Slovníky oproti tomu obsahují i doplňující informace – rozlišení významů slov včetně příkladů konkrétního užití, které uživateli pomohou vybrat slovo relevantní kontextu a také je správně uplatnit v jazykové komunikaci.

Překlady, nabízené překladači, jsou výsledkem automatického zpracování ohromného množství textů, ze kterých poté stroje sestavují konkrétní jazykové a překladové modely. Automatizace a nedostatečná korektura pak často vedou k tomu, že se do přeloženého textu zavlékají různé nejasnosti či chyby, a vznikají tak nesprávné a nesmyslné překlady. Dokonce i nejnovější překladače založené na neuronových sítích poskytnou zcela bezchybný překlad jen asi v 50 % vět.

Pokud zdrojový ani výsledný text není v angličtině, většina překladačů nejprve převede text do anglického jazyka a teprve z anglického textu vychází při překladu do cílového jazyka. Dvojí strojový překlad tudíž nabízí prostor pro dvojnásobné množství chyb a nejasností.
Překladač je výborný nástroj pro člověka, který cizí jazyk umí málo nebo vůbec a potřebuje rychle přeložit celé věty nebo článek. Je ale nevhodný až škodlivý pro toho, kdo se cizí jazyk učí, musí proniknout do jeho podstaty, pochopit jak funguje, vnímat významové a stylové rozdíly i jemné nuance mezi slovy, naučit se správně tvořit věty apod. Právě těmto uživatelům mnohem lépe poslouží jazykový portál slovniky.lingea.cz.

Proč používat portál slovniky.lingea.cz?

  • spolehlivé a aktuální slovníky pro 34 jazyků
  • přesnější než překladač, vhodné i k výuce
  • dostupné on-line a zdarma i na mobilech
  • rychlý a kvalitní zdroj informací pro práci s jazyky

V čem mi portál pomůže?

  • k bezchybnému porozumění psanému i mluvenému slovu
  • k pochopení rozdílů mezi podobnými slovy a jejich významy
  • k výběru nejvhodnějšího překladu v daném kontextu a jeho užití ve správném tvaru či vazbě
  • k aktivnímu rozšiřování slovní zásoby: nabízí 100 tematických okruhů pro učení slovíček
  • k procvičování správné výslovnosti

Proč jsou slovníky vhodné při výuce jazyka?

  • přehledné členění hesla na významy a podle slovních druhů
  • důsledné rozlišování homonym
  • u každého heslového slova je uveden slovní druh, případně rod, u sloves vid
  • hesla obsahují množství poznámek, které zpřesňují překlad slova a usnadňují pochopení významu
  • pokud neexistuje vhodný překlad, je slovo vysvětleno výkladem
  • u sloves uvádíme informaci, s kterou předložkou či s kterým pádem se slovo pojí; tuto základní informaci většina jiných online slovníků postrádá
  • u všech hesel je uveden kompletní přepis výslovnosti IPA, v případě čínštiny v pinyin
  • u italských, ruských a ukrajinských hesel je vyznačen přízvuk
  • v němčině je vyznačen přízvuk u všech homonym, z nichž jedno má odlučitelnou a druhé neodlučitelnou předponu
  • ve vybraných jazycích jsou za heslem uvedeny (nepravidelné) tvary substantiv, adjektiv i sloves
  • nepravidelná slovesa jsou navíc označena hvězdičkou
  • v angličtině, němčině, francouzštině, španělštině, italštině i ruštině si můžete nechat zobrazit podrobné tabulky tvarosloví; a nejen to, u sloves se vám zobrazí kompletní přehled tvoření všech časů, jednoduchých i složených
  • pro hlavní evropské jazyky je též k dispozici vzorová výslovnost namluvená rodilým mluvčím v rozsahu až 40 000 hesel
  • k mnoha heslům se ihned zobrazí synonyma a antonyma, která najdete v levé dolní části okna
  • výbornou pomůckou pro rozšiřování slovní zásoby je i zobrazení dalších slov se stejným kmenem, ale odlišnou předponou či příponou
  • v angličtině jsou přehledně zobrazena i všechna frázová slovesa se stejným základním slovesem
  • studenti ocení i tematické okruhy, např. Barvy, Ptáci, Ovoce, Pevnina, Nemoci, Vaření, Nápoje, Jazyky atd., celkem více než 100 témat v každém jazyku
  • všechna hesla zpracovávají zkušení lingvisté a překladatelé, nejedná se o výsledky strojového překladu ani o automaticky vygenerované dvojice slov podle korpusů

Data jsou skutečně aktuální, stále přidáváme nová hesla a příklady do všech jazyků a celý portál aktualizujeme 3-4x ročně.

Co on-line slovníky Lingea nabízejí navíc oproti jiným internetovým slovníkům?

  • inteligentní hledání
  • výslovnost, konverzace a gramatiky pro hlavní evropské jazyky
  • kompletní tabulky skloňování a časování
  • konkrétní příklady užití slov

Co stojí za kvalitou slovníků?

  • tvoří je profesionální lingvisté a nejedná se tedy o strojový překlad či automatickou extrakci z korpusů
  • jsou pravidelně aktualizované a doplňované o nová slova
  • mnohé jazykové tituly vychází i knižně v 10 evropských zemích
  • na vývoji slovníků pracujeme nepřetržitě už přes 20 let
  • zabýváme se i dalšími jazykovými oblastmi, jako jsou strojový překlad či řečové technologie

Tygeris

Co je to CAT?

CAT je zkratka z anglického computer-aided translation (počítačem podporovaný překlad). Jedná se o široce rozšířený typ software pro profesionální překladatele, bez kterého se moderní překladatelství neobejde.

Poskytuje uživatelské rozhraní pro definici překladových úkolů a vlastní překlad. Klíčové pro produktivitu i kvalitu výsledku je efektivní nerušivé rozhraní, které uživateli ukáže všechny užitečné informace a přitom neruší informacemi v danou chvíli nepotřebnými. V případě překladatelů se jedná zejména o dobrý přehled o kontextu každé překládané věty, dělení na odstavce a podobně.

Důležitou složkou každého CAT nástroje je překladová databáze, do které se průběžně ukládá překládaný text a při budoucích výskytech shodných či podobných segmentů dostává překladatel návrhy z dřívějšího překladu, které buď potvrdí, nebo patřičně upraví. To napomáhá konzistenci a věcné správnosti překladu a současně zrychluje práci.

Čím se liší překladový systém Tygeris od ostatních?

Při vývoji vlastního systému jsme se snažili spojit výhody CAT nástroje a strojového překladače, a navíc při tom zúročit i vlastní jazyková data a technologie. Vycházíme z myšlenky, že i když ne vždy lze strojový překlad bez výhrad využít, jeho oprava je podstatně rychlejší než překlad od začátku. Aby výchozí pozice pro opravu byla co nejlepší, je k dispozici více alternativ, z nichž je možné počáteční překlad vybrat.

Systém je dostupný v on-line verzi, pro jeho využití postačí aktuální webový prohlížeč. V případě potřeby bude možná současná spolupráce více překladatelů na jednom dokumentu. Na rozdíl od off-line spolupráce tak bude možné okamžitě čerpat z výsledků kolegů, čímž bude od počátku usnadněno udržení konzistence textu a terminologie, bez nutnosti pozdější synchronizace. Další výhoda práce on-line je, že všichni, včetně zadavatele, mají přehled o aktuálním stavu a rychlosti postupu překladu.

  • přehledné a intuitivní uživatelské rozhraní
  • varianty nabízených překladů a možností jejich ověření
  • integrované nástroje a data společnosti Lingea
  • napojení a kontextové hledání ve vlastních vysoce kvalitních slovnících
  • konkordance a rozšířené hledání v korpusech
  • přímé napojení Wikipedie