Hlavní obsah

Bič na podvodníky? Práci AI budou odhalovat neviditelné vodoznaky

5:34
5:34

Poslechněte si tento článek

Vysokoškolský učitel inženýrství z Floridské univerzity (UF) v USA vyvíjí digitální vodoznak, který dokáže spolehlivě rozlišit text psaný člověkem a umělou inteligencí. Zajímavé je, že bude neviditelný. Jeho tým se nyní snaží vytvořit systém pro distribuci speciálních klíčů a zajištění odolnosti vodoznaků proti různým úpravám textu.

Foto: Profimedia.cz

Ilustrační obrázek

Článek

Umělá inteligence se stala pro mnohé uživatele pomocníkem jak doma, tak ve škole. Studenti různé chatboty využívají na denní bázi především v rámci psaných úkolů a prací. Velké jazykové modely, jako je ChatGPT nebo Gemini, totiž dokážou generovat velmi kvalitní text podobný lidskému na základě informací z miliard souborů dat.

Pro vyučující a zaměstnavatele naopak může být AI noční můrou, vzhledem k potenciálnímu podvádění ze strany studentů či zaměstnanců. To se už bohužel děje ve velké míře a je to velice těžce zjistitelné.

Spolehlivé řešení

Dle webu USA Today by mohl být řešením právě nový vodoznak vyvíjený odborným asistentem na katedře elektrotechniky a výpočetní techniky Yuhengem Bu.

Používání umělé inteligence dělá lidi hloupějšími. Ovlivňuje kritické myšlení

AI

Pomocí superpočítače HiPerGator na Floridské univerzitě Bu a jeho tým pracují na metodě neviditelného vodoznaku pro velké jazykové modely. Ten by měl spolehlivě odhalit obsah vytvořený umělou inteligencí, a to i jakkoliv pozměněný nebo parafrázovaný.

„Klasické detektory umělé inteligence totiž moc spolehlivě nefungují. Nízký výkon těchto pomocníků je způsoben neustálým pokrokem v oblasti velkých jazykových modelů. Kvůli tomu je text generovaný pomocí AI stále méně rozeznatelný od obsahu psaného člověkem. V důsledku toho je detekce stále obtížnější, a nakonec se může stát nemožnou,“ vysvětlil profesor Bu.

Podle něj by alternativní a účinné řešení měl nabízet vodoznak, který do textu generovaného umělou inteligencí aktivně vkládá speciálně navržené neviditelné signály. Ty slouží jako ověřitelný důkaz generování AI, což umožňuje spolehlivou detekci.

Práce na novém vodoznaku se zaměřuje na dva klíčové aspekty: zachování kvality textu generovaného pomocí velkého jazykového modelu po vložení vodoznaku a zajištění odolnosti vodoznaku proti různým modifikacím.

„Navržená adaptivní metoda zajišťuje, že vložený vodoznak zůstane pro lidské čtenáře nepostřehnutelný a zachová přirozený průběh psaní ve srovnání s původními velkými jazykovými modely,“ dodal Bu.

HiPerGator

Superpočítač Floridské univerzity je cluster (seskupení volně vázaných počítačů), který obsahuje nejnovější generaci procesorů a nabízí uzly pro výpočty náročné na paměť. K vysoce výkonným úložným systémům HiPerGatoru lze přistupovat z různých rozhraní, včetně Globusu, UFApps for Research a dalších nástrojů.

UFIT Research Computing se stará o údržbu clusteru a jeho mnoha částí, což umožňuje výzkumným pracovníkům soustředit se na svůj výzkum namísto údržby hardwaru a softwaru.

Zjednodušení a lepší proces detekce

Ačkoliv je digitální vodoznak relativní novinkou, jiné technologické společnosti již podobné systémy také nějakou dobu vyvíjejí. Například výzkumníci ze společnosti Google DeepMind v loňském roce vytvořili vodoznak pro detekci textu a dokonce ho nasadili mezi uživatele používající chatboty.

Nová metoda floridského profesora ale na rozdíl od jiných aplikuje vodoznaky pouze na část textu během generování. Tím pádem by tato metoda měla dosahovat lepší kvality a větší odolnosti proti útokům na odstranění.

Navíc má vyšší odolnost systému proti běžným úpravám textu, které se používají v každodenním životě, jako je nahrazování synonym a parafrázování. I když uživatel přepíše text opatřený vodoznakem, pokud se nezmění sémantika, zůstane vodoznak detekovatelný. Samotný klíč vodoznaku by měla aplikovat daná platforma.

„Subjekt, který aplikuje vodoznak, je také držitelem klíče potřebného k detekci. Pokud by text opatřila vodoznakem služba ChatGPT, společnost OpenAI by vlastnila odpovídající klíč potřebný k ověření,“ uvedl Bu.

„Koncoví uživatelé, kteří chtějí ověřit vodoznak, musí získat klíč od subjektu, který ho vytvořil. Náš přístup využívá mechanismus soukromého klíče, což znamená, že vodoznak může detekovat a ověřit pouze držitel klíče,“ dodal.

Klíčový nástroj důvěryhodnosti

Hlavní otázkou zůstává, jak koncoví uživatelé tento klíč k vodoznaku vůbec získají. V současném nastavení totiž musí profesor kontaktovat entitu vkládající vodoznak, aby klíč získal. Druhou možností je použití aplikačního programového rozhraní poskytovaného touto entitou k detekci vodoznaku.

„Zásadním krokem je vytvoření komplexního ekosystému vynucujícího používání vodoznaků a distribuci klíčů. Dále také vývoj pokročilejších technik, které se na tento klíč nespoléhají,“ vysvětlil Bu.

Vodoznaky podle něj mají potenciál stát se klíčovým nástrojem důvěryhodnosti a autenticity v éře generativní umělé inteligence.

„Vidím je bezproblémově integrovatelné do škol k ověřování akademických materiálů a napříč digitálními platformami k rozlišení pravého obsahu od dezinformací. Doufám, že jejich široké přijetí zefektivní ověřování a zvýší důvěru v informace, na které se každý den spoléháme,“ uzavřel profesor.

Meta posouvá hranice. Dokáže převést myšlenky do slov napsaných na obrazovce

AI

Výběr článků

Načítám