Jak funguje překladač Skype
Obsah:
- Technologie, která to umožňuje
- Z jednoho mluveného jazyka do druhého během několika sekund
- Testovací program jako výchozí bod
Sci-fi je plná odkazů na technologicky vyspělá zařízení, jejichž fungování, abych parafrázoval mýtický výraz, je k nerozeznání od magie. Vycházíme-li z kreativní mysli jejich autorů, je těžké si představit, kdy by se takové vynálezy mohly dostat do našich rukou a nakonec se smíříme s tím, že se jejich existence nestane součástí našeho životního cyklu. Ale jednou za čas se do našich životů někdo vplíží předčasně. To je případ překladu v reálném čase, který se Microsoft a Skype chystají umožnit
"Úkol není jednoduchý.Zahrnuje schopnost Skype uskutečňovat videokonference, rozsáhlou síť cloudových serverů Microsoft Azure, technologické inovace společnosti Microsoft Research a nedávné pokroky v mnoha oblastech, jako jsou statistiky a strojové učení. To vše je k vašim službám, takže jakmile vyslovíte větu ve svém jazyce, systém rozpozná, co říkáte, přeloží to a předá vašemu kontaktu v jiném jazyce. Jak je to možné?"
Technologie, která to umožňuje
Skype Translator, pod kterým je nová funkce známá, není ani za rok . Skype Translator je výsledkem desetiletí výzkumu v oblasti rozpoznávání řeči, strojového překladu a technik strojového učení. Ve všech těchto oblastech spočívá provoz systému, který by nebyl možný bez nejnovějších pokroků v nich.
Skype Translator je výsledkem desetiletí výzkumu v oblasti rozpoznávání řeči, strojového překladu a technik strojového učení.Počínaje Rozpoznávání řeči, technologií, která se již nějakou dobu zkoumá, ale jejíž přijetí bylo vždy ovlivněno velkým počtem chyb a nadměrné citlivosti stávajících systémů. Stačila vteřina pochybností, malé odchylky v přízvuku nebo minimální hluk, aby počítač zmátl a pochopil, co chce. Tak to bylo, dokud explodoval vývoj technik „hlubokého učení“ a vytváření umělých neuronových sítí, o kterých Microsoft Research něco ví. Díky nim bylo možné výrazně snížit chybovost a zlepšit spolehlivost a robustnost rozpoznávání řeči, což je nezbytný první krok pro fungování aplikace Skype Translator.
strojový překlad je dalším zřejmým pilířem, na kterém Skype Translator spočívá. Zde Microsoft opět používá vlastní technologii a používá překladatelský stroj Bing k překladu textu z jednoho jazyka do druhého.Jeho systém využívá k upřesnění výsledku kombinaci technik rozpoznávání syntaxe a statistických modelů. Při této příležitosti byl navíc motor speciálně trénován, aby rozpoznal typ jazyka, který se vyskytuje v mluvené konverzaci, daleko od správnosti a úhlednosti, která se obvykle předpokládá u písemného projevu. Systém Skype Translator tedy kombinuje rozsáhlou jazykovou znalostní základnu Bing Translator spolu s rozsáhlou vrstvou slov a frází běžně používaných v hovorovém jazyce.
Ale řeč a jazyky jsou komplikovaný terén. Neustále se mění, přicházejí v různých příchutích a odrůdách, každý člověk má svůj vlastní specifický styl atd. S tím vším musí Skype Translator držet krok a vyžaduje neustálé školení a optimalizaci rozpoznávání řeči i strojového překladu. Za tímto účelem systém byl postaven na robustní platformě „strojového učení“, odvětví umělé inteligence, jehož cílem je vyvinout techniky, které umožní strojům a algoritmům učit se trénováním se vzorovými daty.Použití těchto technik, běžných v oblasti statistiky, umožňuje službu zlepšovat při jejím používání a využívat data generovaná při jejím používání k dalšímu zpřesňování rozpoznávání řeči a automatického překladu.
Některá z těchto testovacích dat jsou generována automaticky z celé řady zdrojů, včetně sociálních sítí, jako je Facebook, přeložených webových stránek, videí s titulky nebo dokonce konverzací vytvořených pro tento účel a ručně přepsaných a přeložených . Další část dat však pochází ze skutečných konverzací vedených prostřednictvím služby. To je důležité, protože jak vás společnost Microsoft upozorní při každém hovoru, měli byste vědět, že Skype Translator může zaznamenávat konverzace a udržovat je v anonymitě, aby mohly být později analyzovány jeho algoritmy a zavedeny do tréninkového procesu jejich statistických modelů.
Skype Translator může správně fungovat pouze tehdy, pokud je schopen se učit prostřednictvím procesu založeného na jeho použití ve skutečných lidských konverzacích
"Systém by bez tohoto procesu učení nemohl fungovat. Když lidé mluví, zastavujeme se a opakujeme věci, děláme chyby a měníme své myšlení za pochodu, zavádíme ahs, ehms, uhms>pouze poznání jeho skutečného použití to může zlepšit "
Z jednoho mluveného jazyka do druhého během několika sekund
S podporou všech těchto pokroků klíčem je, že Skype Translator je schopen provést celý proces rozpoznávání a překladu rychle a transparentně pro uživatele Pokaždé, když mluvíme, systém musí rozpoznat, co říkáme, přeložit to do jazyka příjemce a sdělit mu to způsobem, který zůstane věrný tomu, co jsme se původně snažili sdělit.Čím méně si všimneme mezikroků, tím lépe.
Jakmile systém zjistí, že mluvíme, začne zaznamenávat, co říkáme, a zahájí proces rozpoznávání řeči Toto není o nejen rozpoznat každé slovo, které vyslovujeme, ale také odstranit vše nadbytečné, mazat nesmyslné výrazy a šum, detekovat rozdělení textu na věty se zahrnutím interpunkčních znamének a velkých písmen a poskytnout mu kontext pomáhá to vaší interpretaci. Když se nad tím trochu zamyslíte, uvědomíte si, jak těžké je to všechno určit z mluvené řeči.
Skype Translator potřebuje, aby rozpoznávání řeči bylo co nejpřesnější, protože následuje příprava shromážděných informací k porovnání se statistickými modely, které se zlepšujíprostřednictvím systému „strojového učení“.Zde proces spočívá v nalezení podobnosti mezi tím, co systém pochopil, že jsme říkali, a slovy a kontexty obsaženými v modelech, aby se následně použily dříve naučené transformace, které převedou zvuk na text a přeloží jej do cizího jazyka.
V posledním kroku Skype připravil dvojici robotů s ženským a mužským hlasem, kteří v hovoru působí jako tlumočníci Jakmile si uživatel jednu vybere, bude mít na starosti předání naší přeložené zprávy příjemci, aby se na obrazovce objevily nejen psané přepisy a překlady, ale také je mohl slyšet nahlas, jako by byl třetí člověk. prostředník mezi námi.. Tito roboti jsou schopni rychle sdělit zprávu, takže kdokoli poslouchá na druhé straně obrazovky, obdrží zprávu několik sekund poté, co ji vyslovíme.
Testovací program jako výchozí bod
Právě přítomnost robotů jako mluvčích třetích stran v konverzaci je jedním z detailů, které ještě zbývá doladit. Microsoft si uvědomuje, že přizpůsobení se jim je snadné pro lidi, kteří jsou zvyklí mluvit přes tlumočníka, ale pro ostatní to vyžaduje období učení. A je to tak, že Microsoft a Skype mohou být odhodláni vytvořit nejlepší překladatelskou zkušenost v reálném čase, která existuje, ale k tomu potřebují, abychom se naučili sebe i strojeNáhled aplikace Skype Translator je jen dalším krokem v tomto procesu.
Testovací program byl spuštěn v polovině prosince a představil mluvený překlad mezi dvěma jazyky: angličtinou a španělštinou a psaný překlad ve více než 40 Pro přístup je nutná pozvánka, kterou si můžeme vyžádat registrací na webu programu. Pokud s ním budeme poctěni, můžeme vyzkoušet Skype Translator z aplikací Skype pro Windows 8.1 nebo Windows 10 Technical Preview. Jinak budeme muset počkat, až bude služba rozšířena a oficiálně zveřejněna.
"Každopádně Skype Translator odstartoval právě ve chvíli, kdy se chystáme rozloučit se s rokem 2014. Než skončíte, zastavte se zde na chvíli a zamyslete se nad rokem, který jste právě četli: dva tisíce čtrnáct>"
Via | Blogy Skype I, II