Článek
Výsledky studie ukazují, že dekodér dokáže s neuvěřitelnou přesností rekonstruovat řeč, a to i tehdy, když účastníci pouze poslouchali příběh nebo si jej představovali. Tento objev poskytuje naději, že bude možné vytvořit nové metody, jak vrátit řeč lidem, kteří ztratili schopnost mluvit v důsledku různých neurologických poruch, jako je například mrtvice nebo amyotrofická laterální skleróza (ALS).
Průlom v oblasti umělé inteligence může být velmi užitečný pro lidi s komunikačními problémy, a to nejen pro ty s neurologickými poruchami, ale i pro lidi s jinými druhy postižení, jako jsou například lidé s těžkým autismem nebo s obrnou. V praxi to může výrazně zlepšit kvalitu jejich života a umožnit jim komunikovat s ostatními bez omezení.
Neurolog Alexander Huth, který studii vedl, poznamenal, že jej přesnost zařízení poněkud šokovala. „Docela nás šokovalo, že to tak dobře funguje. Pracuji na tom 15 let… takže bylo šokující a vzrušující, když to konečně začalo fungovat,“ uvedl pro server The Guardian.
Umělá inteligence je při hodnocení ultrazvuku srdce lepší než lidé
Zásadní omezení fMRI překonáno
Tento úspěch překonává zásadní omezení fMRI, které spočívá v tom, že tato technika sice dokáže zachycovat mozkovou aktivitu v konkrétním místě s neuvěřitelně vysokým rozlišením, avšak má časovou prodlevu, která znemožňuje sledování mozkové aktivity v reálném čase. Zpoždění vzniká proto, že fMRI mapuje neuronální aktivitu nepřímo, v návaznosti na změny v prokrvení. „Je to hlučný, pomalý zástupce nervové aktivity,“ řekl Huth.
Toto omezení ztěžuje schopnost interpretovat mozkovou aktivitu v návaznosti na přirozenou řeč, protože poskytuje „změť informací“ rozloženou do několika sekund. Rozvoj takzvaných velkých jazykových modelů, tedy takových, na kterých je založen například chatbot ChatGPT společnosti OpenAI, však otevírá novou cestu. Velké jazykové modely jsou schopny číselně reprezentovat sémantický význam řeči, což vědcům umožnilo sledovat, které vzorce neuronální aktivity odpovídají řetězcům slov s určitým významem, místo aby se pokoušeli číst aktivitu slovo po slově.
Postup byl náročný, každý ze tří dobrovolníků musel strávit 16 hodin v přístroji magnetické rezonance a poslouchat podcasty. Dekodér se naučil přiřazovat k mozkové aktivitě význam pomocí velkého jazykového modelu GPT-1, předchůdce modelu ChatGPT. Později byli stejní účastníci snímáni při poslechu jiného příběhu nebo při představě, že vyprávějí příběh, a dekodér byl použit k vytvoření textu pouze na základě mozkové aktivity. Přibližně v polovině případů se text shodoval, někdy velmi přesně, se zamýšleným významem původních slov.
„Náš systém pracuje na úrovni myšlenek, sémantiky, významu,“ řekl Huth s tím, že zařízení zachycuje nikoliv přesná slova, ale podstatu sdělení.
Anketa
Například když účastník slyšel větu „Ještě nemám řidičský průkaz“, dekodér to přeložil jako „Ještě se ani nezačala učit řídit“. Jindy naopak slova „Nevěděla jsem, zda mám křičet, brečet nebo utéct. Místo toho jsem řekla: 'Nech mě být!'“ přeložil jako „Začala křičet a plakat a pak jen řekla: ‚Říkala jsem ti, abys mě nechal na pokoji‘.“
Účastníci studie také sledovali krátká videa a zařízení je poté na základě jejich mozkové aktivity popsalo. V některých případech se stroj spletl, potíže má zejména s osobními zájmeny. Dekodér byl rovněž personalizovaný, takže měl nesrozumitelný výstup při použití na jiné osobě. Účastníci také mohli systém obelhat tím, že si představovali zvířata či jiný příběh.
Fenomén jménem ChatGPT
Umělá inteligence se dostala do středu pozornosti s rozvojem ChatGPT. Tento chatovací systém dokáže generovat různé texty včetně článků, esejí, vtipů a poezie na základě jednoduchých dotazů. ChatGPT se učí odpovídat na podněty uživatelů a podobně jako lidé se učí na základě velkého množství dat.
V květnu 2024 byl zpřístupněn pokročilejší model umělé inteligence GPT-4o. Ten je schopen poskytovat bezpečnější a užitečnější odpovědi a připravit půdu pro šíření technologií podobných lidem. Zvládá simulovat i emoce.
Webovou aplikaci nabízí OpenAI zdarma, v placené verzi ale můžete systém využívat i ve chvíli, kdy je velmi zatížen. Ostatní musí čekat na uvolnění kapacity. Předplatné, které nabízí i další výhody, vyjde případné zájemce na 20 dolarů měsíčně, tedy v přepočtu zhruba na 480 Kč.
Za ChatGPT stojí start-up OpenAI, který financuje společnost Microsoft.