Článek
Vývojáři oblíbeného digitálního asistenta Claude AI se rozhodli spojit se společností Hume AI, která vyvinula zbrusu nové rozhraní Empathic Voice Interface 2 (EVI 2). To dokáže naučit umělou inteligenci, jak má interpretovat hlasové příkazy, porozumět emocím za těmito interpretacemi a poté vhodně reagovat.
EVI 2 tedy dokáže převést mluvené slovo na smysluplný text. Ten dále Claude zpracovává k provádění příkazů, jako je pohyb myši, klikání na tlačítka nebo dokonce pořizování snímků obrazovky. Umělá inteligence pak své činy vysvětlí jednoduchým jazykem, jenž rozhraní transformuje do přirozeně znějící řeči podobné té lidské.
Dle webu TechRadar jde o víc než jen porozumění a odpovídání na uživatelovy nálady při konverzaci. EVI 2 navíc dokáže vyhladit spojení mezi tím, co říkáte, a tím, jak může Claude ovládat samotný počítač.
Jak ChatGPT mění svět
Jedná se tedy o smysluplnou konverzaci, ale zároveň i o způsob, jak velmi přesně a jednoduše dokončit úkoly na počítači bez myši nebo klávesnice.
„Integrací Claude s EVI jsme vytvořili něco skutečně výjimečného. Claudovy hraniční schopnosti přirozeného jazyka a jeho osobnost se doplňují s porozuměním výrazům a empatií EVI. Rozhraní EVI může „hrát“ Claudovy odpovědi a vytvářet plynulé konverzace s ohledem na kontext, které působí pozoruhodně lidsky,“ vysvětlil zakladatel společnosti Hume Alan Cowen v příspěvku na blogu.
„Claude je velmi výmluvný. Má opravdu dobrou osobnost, se kterou si lidé rádi povídají,“ dodává Cowen.
Jedinečnost tkví v emoční inteligenci
Podle tvůrců dělá tento systém jedinečným právě jeho emoční inteligence. Namísto prostého následování pokynů může Claude upravit svůj tón hlasu a přístup na základě kontextu.
Například pokud uživatelé potřebují pomoct s uspořádáním úkolů a zároveň se cítí ve stresu, mohou chatbota požádat o technickou, ale i emocionální podporu. Claude by měl být tedy schopný reagovat konejšivým hlasem a díky tomu je celá interakce lidštější.
Hlasem ovládaná umělá inteligence samozřejmě není úplnou novinkou. Dle webu Firstpost se tento trend dávat generativním asistentům umělé inteligence hlasová rozhraní objevuje stále častěji.
Na rozdíl od dřívějších asistentů od Amazonu a Google, chatboti jako ChatGPT s jeho pokročilým hlasovým režimem nebo Copilot Voice od Microsoftu dokážou mnohem lépe konverzovat, reagovat na změny a zvládat složité, vícestupňové úkoly. Claude ve spolupráci s EVI 2 navíc nabízí emocionálně inteligentní rozhovory a lepší adaptaci.
Kromě pohodlí má tato inovace i praktické využití pro usnadnění přístupu. Díky hand-free (ovládání bez použití rukou) mohou být tyto technologie uživatelsky přívětivější pro osoby s různým zdravotním postižením nebo usnadňovat multitasking.
The Washington Post má dalšího AI chatbota. Odpoví téměř na cokoliv
Významný krok vpřed
Přestože má hlasově ovládaná umělá inteligence velký potenciál, existují zádrhele, které musí společnosti nejdříve vyřešit.
Chyby umělé inteligence – tzv. halucinace, by mohly mít katastrofální následky, pokud by AI měla kontrolu i nad soubory počítače nebo by špatně interpretovala daný příkaz.
Obavy o ochranu soukromí jsou také na místě, protože hlasové interakce by mohly zaznamenávat údaje rovnocenné historii prohlížení nebo stiskům kláves. Vyvážení inovace s bezpečností a důvěrou je tedy na místě.
I přesto tato dohoda mezi společnostmi Hume AI a Anthropic představuje významný krok vpřed v personalizaci umělé inteligence. Právě díky schopnosti kombinovat emoční inteligenci s praktickým ovládáním počítače by se mohlo jednat o revoluci toho, jakým způsobem budou uživatelé komunikovat se svými zařízeními.