Hlavní obsah

AI DolphinGemma zpracovává a generuje delfíní vokály

3:54
3:54

Poslechněte si tento článek

Výzkumníci z Georgijského technologického institutu (Georgia Tech) a organizace Wild Dolphin Project (WDP) pracují na specializovaném velkém jazykovém modelu umělé inteligence s názvem DolphinGemma. Ve spolupráci se společností Google vědci vytvářejí model určený k analýze komunikačních vzorců delfínů, včetně cvakání, pískání a pulzování, které tvoří delfíní vokalizaci.

Foto: Profimedia.cz

Ilustrační obrázek

Článek

Delfíni jsou obecně považováni za jedny z nejchytřejších tvorů na planetě. Výzkumy prokázaly, že dokážou spolupracovat, vzájemně se učit novým dovednostem, a dokonce se rozpoznat v zrcadle.

Vědci se snaží už desítky let porozumět složitému souboru pískání a cvakání, které delfíni používají ke komunikaci. S pomocí nového jazykového modelu umělé inteligence DolphinGemma a organizaci Wild Dolphin Project by mohli vědci v této oblasti brzy pokročit, píše web Ars Technica.

Wild Dolphin Project provádí terénní výzkum atlantských delfínů skvrnitých na Bahamách od roku 1985, a to pomocí inovativního neinvazivního přístupu. Organizace pořizuje videozáznamy a zvukové záznamy delfínů, které jsou spojeny s identitou jednotlivých delfínů. Zároveň zaznamenávají související poznámkami o jejich chování.

Výzkumníci se domnívají, že pochopení struktury a vzorců vokalizace delfínů je nezbytné k určení, zda jejich komunikace dosahuje úrovně jazyka. „Nevíme, zda zvířata mají slova, ale postupně tomu přicházíme na kloub,“ řekla vědkyně z WDP Denise Herzingová.

Podvodní počítačový systém CHAT

AI DolphinGemma funguje jako audio-in, audio-out model, který zpracovává sekvence zvuků delfínů za účelem identifikace vzorů a struktury, podobně jako jazykové modely pro lidskou komunikaci předpovídají následná slova ve větách, píše web AI Magazine.

Model využívá tokenizér SoundStream společnosti Google k efektivní reprezentaci delfíních zvuků. Tento model se 400 miliony parametrů běží i na chytrých telefonech, které výzkumníci používají při své práci v terénu.

Kromě analýzy přirozené komunikace vyvinula společnost WDP ve spolupráci s Georgia Tech podvodní počítačový systém CHAT (Cetacean Hearing Augmentation Telemetry). Ten by měl do budoucna vytvořit společný slovník mezi lidmi a delfíny pomocí syntetického pískání spojeného s objekty, které delfíny zajímají.

Systém vyžaduje schopnosti zpracování zvuku v reálném čase, aby bylo možné identifikovat vokalizace delfínů uprostřed hluku oceánu a poskytnout zpětnou vazbu vědcům prostřednictvím sluchátek vedených kostmi

DolphinGemma jako otevřený model

Spolupracující organizace společně s Googlem letos v létě plánují uvolnit AI DolphinGemma jako otevřený model, který bude k dispozici výzkumníkům zkoumajícím další druhy kytovců.

Ačkoliv je model vycvičen na zvuky delfína skvrnitého, výzkumníci i přesto předpokládají jeho potenciál využití pro vědce studující jiné druhy kytovců, například delfíny skákavé nebo delfíny rodu Spinner.

„Doufáme, že vytvářením AI modelů, jako je DolphinGemma, poskytneme vědcům po celém světě nástroje k vytěžování jejich vlastních souborů akustických dat, urychlíme hledání vzorů a společně prohloubíme naše porozumění těmto inteligentním mořským savcům,“ vysvětlila společnost Google ve své tiskové zprávě.

Výběr článků

Načítám