Neuronová síť Googlu si vytvořila vlastní jazyk pro překlady

0
2683

Google vypustil do svého jazykového překladače strojové učení se záměrem, že časem zlepší a nahradí stávající statistický model. Ten jednotlivé věty překládá tak, že na základě analýz hromady jazykových párů spočítá, že výrazu A v jednom jazyce odpovídá nejpravděpodobněji výraz B v druhém jazyce. Statistický překladač vůbec nemusí rozumět tomu, co vlastně překládá, jen hledá podobné páry. Strojové učení mělo přinést hloubkové učení, kdy se stroj jako člověk naučí, co k čemu patří. A překlady by pak měly dávat větší smysl.

Strojové učení

Inženýři z Googlu začali experimentovat s překlady zero-shot. Neuronová síť se nejprve naučila několik jazykových párů, které spolu nějak nepřímo souvisely. Kdyby neuronová síť na základě znalosti těchto překladových párů dostala příkaz, ať něco přeloží z japonštiny do korejštiny, přímo tento jazykový pár nezná, ale nepřímo jej zná skrze prostředníka, angličtinu. Překlad podle Googlu skutečně dával smysl, což nakonec inženýry vedlo k otázce, jak je samotná znalost v neuronové síti uložená. Neuronová síť si při učení zřejmě vytváří vlastní univerzální jazyk, díky kterému by mohla přeložit jakýkoliv jazykový pár, pokud o něm alespoň nepřímo něco ví.

Jazyk překladače

Je to velmi složitá znalostní struktura, kterou lze vyjádřit pomocí geometrie. Inženýři Googlu v 3D grafu zobrazili strojovou znalost, naučený model, jako strukturu teček, kde každému shluku odpovídá věta. Pak zjistili, že stroj do takových shluků zařazuje ze všech známých jazyků. Neuronová síť překladače Googlu tak organizuje věty se stejným významem v různých jazycích do podobných geometrických struktur. Díky tomu nyní dokáže experimentálně překládat i mezi jazykovými páry, které až doposud neznala. Vytvořila si jakýsi geometrií vyjádřený sémantický jazyk. Stroj během učení párů objevil i vztah mezi japonštinou a korejštinou, který se přímo neučil. Shluky teček jsou v jeho podání interlingua – mezijazyk, díky kterému lze překládat i jazykové páry, které zatím nezná.


ZANECHAT ODPOVĚĎ

Please enter your comment!
Please enter your name here