Jak lze dosáhnout toho, aby člověk ovládal více jazyků než jen jeden či dva? Tuto myšlenku si dlouhá léta malovali spisovatelé ve svých sci-fi románech a režiséři ve filmech. Možná si pamatujete na Létajícího Čestmíra, který měl sbírku velmi originálních květin, nebo jste četli knihu Stopařův průvodce po galaxii, kde hlavní postava Arthur dostal od Forda Perfecta do ucha babylonskou rybku. Tato rybka se živila mozkovými vlnami a do mysli svého nositele vypouštěla telepatické myšlenkové frekvence. Díky tomu Arthur rozuměl řečem všech galaktických ras.

Už v roce 1945 také napsal Murray Leinster novelu První kontakt, ve které byla všem k dispozici komunikační krabička nazvaná univerzální překladač. Tento přístroj se stal oblíbeným prvkem v mnoha vědeckofantastických románech od Star Treku (univerzální překladač a vynález "LinguaCode") až po Dr. Who s jeho TARDIS.

Reálný předchůdce

Toto je všechno sci-fi, vraťme se tedy zpět do reality. Dlouhou dobu jsme se potýkali s tím, že žádný systém nedokázal provádět rychlé a kvalitní překlady. V roce 2017 však společnost Google představila sluchátka Pixel Buds, která umožňovala komunikaci mezi lidmi mluvícími různými jazyky. Tento systém byl však náročný a fungoval pouze mezi angličtinou a několika hlavními jazyky. Navíc závisel na přesné výslovnosti a porovnávání s online databází, což snižovalo přesnost a spotřebovávalo datový tok. Postupem času se stal užitečným nástrojem pro cestování do zemí s problematickou komunikací, jako je například Čína. Přesto se jednalo o řešení s určitými nedostatky, a proto se nepoužívalo pro důležitá obchodní jednání, kde je potřeba absolutní přesnost.

Překlad do ucha

Nicméně v září roku 2022 nastal zlom. Společnost OpenAI představila impozantní jazykový model jménem ChatGPT, který dokáže komunikovat v mnoha jazycích, a dokonce má i schopnost učení. To zahájilo závod, kterým se snažily různé společnosti aplikovat umělou inteligenci rychleji, komplexněji a s větší originalitou. Významný pokrok v oblasti překládání, který již dříve udělal Google nebo překladač Deepl, začal působit zastarale a bylo zapotřebí dosáhnout dalšího pokroku ještě rychleji.

Společnost Meta tedy nyní pracuje na nástroji SeamlessM4T, multimodálním modelu umělé inteligence, který je určený pro překlady mezi mluveným a psaným textem. Co vše dokáže? Umí překládat mluvený text na psaný, psaný text na mluvený, a dokonce i mluvený text na jiný mluvený text. A to ve stu různých jazycích, z nichž 36 má také zvukový výstup (včetně češtiny). Tuto funkci můžete vyzkoušet na jejich beta verzi.

Možná máme před sebou poslední pololetí, kdy se učíme jazyky ve školách, než si jednoho dne jen zakoupíme aplikaci...

Při prezentaci této novinky společnost Meta odkazuje na babylonskou rybku. „Vytvořit univerzální jazykový překladač, podobný fiktivní babylonské rybce ze Stopařova průvodce po Galaxii, bylo náročné, protože existující systémy pro převod mluveného a psaného textu pokrývají jen zlomek světových jazyků. Nicméně věříme, že práce, kterou dnes představujeme, je na této cestě významným krokem vpřed.“

Společnost Meta trénovala tento neuronový model pomocí 4 milionů hodin nezpracovaného zvukového materiálu z veřejných zdrojů a volně dostupných dat. Čtvrtina dat byla v angličtině, takže výsledky jsou nejlepší právě v tomto jazyce. Nicméně i v češtině jsou fantastické. Můžete si to sami ověřit tím, že si přeložíte text z češtiny například do italštiny nebo zpět.

Je nutno zdůraznit, že se stále jedná o testovací model, a to dokonce veřejně dostupný. Meta vydala SeamlessM4T pod veřejnou výzkumnou licencí (CC BY-NC 4.0), což umožňuje i dalším vývojářům, aby se do vývoje zapojili. Tento krok je obdobný tomu, který udělala společnost OpenAI s modelem ChatGPT. Každý, kdo aplikaci vyzkouší, něco napíše nebo nahraje, přispěje k velkému datovému testovacímu souboru, který bude sloužit k dalšímu zdokonalení modelu.

Kdy se můžeme dočkat osobního univerzálního překladače? Těžko říci. Nicméně tento okamžik se nejspíše blíží. Možná máme před sebou poslední pololetí, kdy se učíme jazyky ve školách, než si jednoho dne jen zakoupíme aplikaci...

Související…

Fotografové, úředníci i lékárníci. Umělá inteligence může ukrást práci i vám
František Mašek

foto: Shutterstock, zdroj: Reuters