Článek
Svou technologií Deep Embeddings jako první na světě pro identifikaci mluvčího využívá výhradně hluboké neuronové sítě umělé inteligence, která se stále více snaží o stejné výkony, které dokáže i lidský mozek.
„Naše technologie analyzují hlas z nahrávky či telefonického rozhovoru a na základě toho umožňují identifikovat řečníka, jeho pohlaví nebo přibližný věk. Dokážou i z několika hlasů najednou vytáhnout hlas konkrétní osoby, monitorovat výskyt konkrétních frází v řeči a mluvené slovo přepsat do psané podoby,“ uvádí Michal Hrabí, výkonný ředitel společnosti.
„Využití nachází jak v komerční sféře, tak při identifikaci pachatelů trestných činů nebo odhalování teroristických hrozeb. V komerčním sektoru se naše technologie mohou uplatnit například u služeb hlasových asistentů, při hlasové autorizaci úkonů v bankách či pojišťovnách nebo v call centrech,” říká Michal Hrabí.
I hlasový otisk obsahuje nezaměnitelnou biometrickou informaci
Technologie obstojí i v extrémně hlučném prostředí. Dokázal to pokus, na kterém se podíleli i vědci z brněnského Vysokého učení technického a z USA. I když nebyl přes hluk hlas takřka slyšet, podařilo se rozeznat jazyk a pohlaví mluvčích, identifikovat je.
Novou technologii Deep Embeddings představila Phonexia letos na jaře. Pro identifikaci a ověření mluvčího hluboké neuronové sítě analyzují krátké úseky hovoru a samy se učí rozpoznávat unikátní prvky hlasu každé osoby.
Stejně jako třeba otisk prstu nebo scan oční rohovky i hlasový otisk obsahuje nezaměnitelnou biometrickou informaci, kterou dokážou neuronové sítě rozpoznat a přiřadit ji pak ke konkrétnímu mluvčímu.
Nejnovější technologie je dvakrát rychlejší a 2,4krát přesnější než předchozí verze. „Vyšší přesnost a rychlost šetří čas i peníze – ať už jde o snížení pravděpodobnosti, že bude klient omylem odmítnut při hlasovém ověření, nebo o zvýšení šance odhalení podvodníka, který si chce pod identitou někoho jiného třeba vzít bankovní půjčku,“ doplnil technický šéf firmy Petr Schwarz.
Phonexia vznikla v roce 2006, kdy ji založil tým vědců brněnské Fakulty informačních technologií VUT, který se rozpoznáváním řeči zabýval v rámci univerzitního výzkumu. Obrat společnosti v roce 2017 oproti předchozímu období vzrostl o 90 procent, čtyři pětiny z toho má „na svědomí“ zahraničí.