Doby, kdy strojové překladače generovaly sotva srozumitelnou hatmatilku, jsou dávno pryč. Do univerzálního překladače jak ze Star Treku máme sice ještě daleko (tedy ne že by se o něj někteří nepokoušeli), slušně srozumitelné překlady webů jsou však už díky Google Translate samozřejmostí.
V poslední době jsem ale hned od několika lidí dostal tip na nástroj, který podle nich tomu od Googlu dává na frak. Jmenuje se DeepL… a když jsem si ho trochu progooglil, bylo těžké narazit na něco jiného než chvalozpěv.
Řekl jsem si, že by možná stálo za to ho porovnat právě s Google Translate. Dal jsem jim oběma přeložit stejný text — kousek tohohle článku od Dereka Siverse. Vybral jsem myslím docela jednoduchou pasáž. Některé obraty můžou být výzva, rozhodně to ale není text plný metafor nebo složitých idiomů:
I rarely cry, but I cried a lot last month, leaving New Zealand. I’ve never loved and felt so connected to a place before. It wasn’t simple sadness that made me cry, but overflowing appreciation. I’d been feeling it for years, almost every day, amazed at not just the nature but the people and way of life.
Knowing I was leaving made me re-play all my memories from my last six years. Most of that time spent playing in the wilderness with my kid. The memories are so overwhelmingly wonderful that seeing them all together like that made me sob with appreciation. They’ve been the happiest years of my life. Leaving felt like tearing a child from its mother.
Takhle si s ním poradil Google Translate:
Zřídka pláču, ale minulý měsíc jsem hodně plakal, takže (1) jsem opustil Nový Zéland. Nikdy předtím jsem nemiloval a necítil se tak spojený s místem (2). Nebyl to prostý smutek, který mě rozplakal, ale překypující uznání (3). Cítil jsem to roky, téměř každý den, ohromen nejen přírodou, ale i lidmi a způsobem života.
Vědomí, že odcházím, mě nutilo znovu přehrát všechny mé vzpomínky z posledních šesti let. Většinu času jsem strávil hraním v divočině se svým dítětem. Vzpomínky jsou tak ohromně úžasné, že když jsem je všechny viděl takhle společně, vzbudil jsem uznání (4). Byly to nejšťastnější roky mého života. Odchod měl pocit, jako by odtrhl dítě od matky (5).
Upřímně žádná sláva. Většina překladu sice dává smysl a žádné gramatické nesmysly à la „já mluvit dobrá česky“ se nekonají, chyby v něm ale rozhodně jsou.
Vyložený průšvih je hned v (1) — autor píše, že hodně plakal, když opouštěl Nový Zéland, ne že opustil Nový Zéland, protože plakal.
Podobně nesmyslná je fráze „vzbudil jsem uznání“ v (4) jako překlad „made me sob with appreciation“. Originál totiž znamená, že Derek začal samým dojetím/vděčností za ty krásné zážitky vzlykat.
A věta (5) mi připomněla staré dobré časy™, kdy jsme s kamarádkou soutěžili, kdo dokáže Google Translate přimět vytvořit větší nesmysl. Celá věta je úplně mimo — Derek píše, že opustit Nový Zéland pro něj bylo podobné, jako kdybyste matku odtrhli od jejího dítě.
Části (2) a (3) smysl dávají, přijdou mi jen trochu neobratné.
Musím říct, že mě výsledek dost překvapil. Nečekal jsem překlad jak od profíka, ale některé chyby v tomhle překladu byly tak zásadní, že by čtenáře mohly pořádně zmást.
Pojďme se podívat, jak si se stejným textem poradil DeepL:
Málokdy brečím, ale minulý měsíc jsem při odjezdu z Nového Zélandu brečela (1) hodně. Nikdy předtím jsem žádné místo tak nemilovala a necítila se s ním tak spojená. (2) Nebyl to prostý smutek, co mě rozplakalo, ale překypující vděčnost. Cítila jsem to už roky, téměř každý den, žasla jsem nejen nad přírodou, ale i nad lidmi a způsobem života.
Vědomí, že odjíždím, mě přimělo znovu si přehrát všechny vzpomínky z posledních šesti let. Většinu toho času jsem strávil (3) hraním si v divočině se svým dítětem. Ty vzpomínky jsou tak ohromně krásné, že když jsem je viděl takhle pohromadě, vzlykal jsem vděčností. Byly to nejšťastnější roky mého života. Odchod byl jako odtržení dítěte od matky.
Tak tohle je úplně jiná liga. Nebýt jednoho úletu, nejsem si jistý, jestli bych poznal, že za tímhle překladem nestojí člověk. Srovnejte si třeba, jak se s částí (2) vypořádaly oba překladače:
- Nikdy předtím jsem nemiloval a necítil se tak spojený s místem. (Google)
- Nikdy předtím jsem žádné místo tak nemilovala a necítila se s ním tak spojená. (DeepL)
Určitě se shodneme, že druhý překlad je mnohem elegantnější.
Tím úletem mám na mysli fakt, že se DeepL rozhodl v půlce textu změnit pohlaví autora (porovnejte si 1 a 2). Možná si o mně budete myslet, že jsem mileniálská sněhová vločka, ale mám pocit, že volba ženského rodu ve větě o pláči nebyla úplně náhodná.
Není to totiž nic nového. Na něco podobného výzkumníci narazili při překladech z maďarštiny do angličtiny v Google Překladači. Maďarština na rozdíl od angličtiny nerozlišuje mezi on/ona, takže si překladač musel vybrat. A vybral docela zajímavě. Pro mužský rod se rozhodl u vět jako „on je chytrý“ a „on vydělává spoustu peněz“, zatímco po tom ženském sáhl u „ona je krásná“ a „ona peče dort“.
Naštěstí to není tak, že by v Googlu pracoval nějaký sexista, co by překladač učil rozlišovat mezi „ženskými“ a „mužskými“ aktivitami. Tomuhle fenoménu se říká machine bias a je to něco, čemu se vědci dost věnují. Souvisí to s tím, jak se podobné algoritmy trénují: používá se k tomu obrovské množství dat, na kterém se učí rozpoznávat souvislosti — moc hezky to vysvětluje CGP Grey v tomhle devítiminutovém videu. No a protože jsou ta data vytvořená lidmi, odráží se v nich lidské předsudky a stereotypy.
Anyway, napadlo mě, že něco podobného by mohlo jít udělat i s překladem českého textu. Vytvořil jsem pár vět, ze kterých není jasný rod, a nechal je přeložit. Tady jsou výsledky:
- Vaří. = He cooks.
- Rodí. = She gives birth.
- Uklízí. = She cleans up.
- Řídí firmu. = He runs the company.
- Vraždí souseda. = He kills a neighbor.
- Pláče. = She is crying.
- Skládá oblečení. = She composes clothes.
Jen k tomu poslednímu překladu: „skládat oblečení“ se v angličtině řekne „fold clothes“. „Compose“ můžete třeba symfonii.
To je pro dnešek všechno. V pondělí zase na přečtenou! 🙂
Tom