Microsoft oznamuje, že jeho technologie rozpoznávání řeči snižuje chybovost a je stejně účinná jako lidé
Je to jeden z pilířů, na kterém mnozí prohlašují, že různé platformy v blízké budoucnosti porostou. Nic, co by interagovalo s písemnými příkazy nebo gesty. Budoucnost spočívá v mluvení se stroji, ale ne v mluvení pomocí robotických příkazů a nepřirozených příkazů. Uděláme to přirozeným jazykem, což u osobních asistentů oceňujeme stále zřetelněji."
A jednou z firem, která má v tomto smyslu nejpozoruhodnější kariéru, je Microsoft, společnost, která má za sebou vývojovou cestu, ve které neustále zlepšuje rozpoznávání hlasu zaměstnanců než na jejich platformách.Technologie, o které nyní máme zprávy od vývojového týmu, zprávy, které hovoří o skvělém vylepšení, které ji staví na stejnou úroveň přesnosti jako u lidí
V tomto smyslu oznámili, že jejich systém rozpoznávání hlasu dosáhl 5,1 % ve WER, což je chyba v rychlosti použitého slova. Mnohým to možná nic neříká, ale je překvapivé, když vidíme, jak je na jedné straně tato míra stejná jako ta, kterou nacházíme v komunikaci mezi lidmi
Za tímto účelem se z Redmondu rozhodli využít vylepšené modely verbálního a akustického jazyka založené na použití neuronových sítíTyto jsou Jsou kombinovány s dlouhodobou obousměrnou pamětí, aby se zlepšilo akustické modelování, a tím se zlepšilo rozpoznávání díky predikci slov, která lze použít na základě historie komunikace.Tato vylepšení mají také podporu cloudu díky úsilí, které společnost vynaložila na zlepšení infrastruktury cloud computingu, zejména s Azure.
To navíc znamenalo, že tato chybovost byla snížena, pokud jde o míru selhání, protože dříve byla 5,9 %, tedy pokles z 12 %, což bylo číslo, které měl systém před méně než rokem. Proto Microsoft dosáhl systému rozpoznávání řeči, který je stejně účinný jako ten lidský, a když vidí pokrok, který procházejí, není divu, že jej v nadcházejících měsících či letech dokonce vylepší.
Kdo ví, jestli za pár let od nynějška bude mluvit s naším Windows PC, interakce s Cortanou nebo aplikacemi jako Office něčím tak přirozeným jako to, o čem jsme už snili (nebo máme noční můry, kdo ví) v kině.
V Xataka | Nejsou to hlasy ze záhrobí, jsou to skryté příkazy, které hlasoví asistenti rozpoznávají a lidé ne