Článek
AI systém (systém umělé inteligence) Vidu umožňuje uživatelům vytvořit v podstatě na pár kliknutí až šestnáctisekundové video ve vysokém rozlišení, které se může směle měřit s profesionálními filmařskými počiny. I bez kamer a budování nákladných scén totiž Vidu dovede vytvořit videa, která jsou k nerozeznání od reality. A je jedno, zda se bavíme o přirozeném pohybu vody, nebo rušném nočním panoramatu města.
Podle tvůrců se Vidu liší od konkurenčních AI systémů na tvorbu videa tím, že dovede pracovat i s kulturně specifickými prvky. Konkrétně u čínských témat tak dovede brilantně zapracovat pandy.
První ukázky, které se již šíří na sociálních sítích, naznačují, že se Vidu konkurenčním systémům nejen vyrovná, ale v některých ohledech je i předčí, uvedl server Medium. Narážel přitom především na obrazovou konzistenci produkovaných videí.
🚨BREAKING! #China announced its rival to #OpenAI’s Sora. Vidu, the Text-to-video AI model allows generating 16-second 1080 pixel resolution videos from text prompts. It utilizes Universal Vision Transformer (U-ViT) architecture-integrates the both Diffusion & Transformer models pic.twitter.com/OOoSlhjOEB
— Kaneshwaran Govindasamy (@global_5G) April 28, 2024
🧵 FULL 16 SECOND AI clips generated by Vidu, China’s #SORA competitor
— Andrew Gao (@itsandrewgao) April 28, 2024
Do you think it’s better than SORA?
Thank you to @tikgiau for finding these
👇🧵👀👀 pic.twitter.com/hIsQ0ReiOs
Umělá inteligence naklonuje hlas člověka. Stačí jí 15 sekund
Co umí Sora?
Sora od ChatGPT nicméně dovede vytvořit videa o délce až 60 sekund s vysoce detailními scénami, složitým pohybem kamery a mnoha postavami s živými emocemi.
„Krásné zasněžené Tokio je plné života. Kamera se pohybuje rušnou ulicí města a sleduje několik lidí, kteří si užívají krásné, zasněžené počasí a nakupují v okolních stáncích. Nádherné okvětní lístky sakury létají větrem spolu se sněhovými vločkami,“ prezentovali tvůrci nové schopnosti umělé inteligence na síti X.
Zmiňované realistické video se záběry Tokia si můžete prohlédnout níže, v úvodu tohoto článku pak naleznete další sérii tří ukázek přímo od OpenAI.
Sora je však zatím k dispozici pouze vybraným uživatelům, kteří ji mohou testovat. Od minulého týdne, kdy si nový AI systém odbyl premiéru, navzdory tomuto omezení zaplavují sociální sítě stále nové výtvory.
Německý ovčák proměněný v kyborga, tygr stvořený z květin či historický pohled do Kalifornie během zlaté horečky. Navzdory tomu, jak realisticky všechna videa níže vypadají, jde o tvorbu Sory.
Šéf společnosti OpenAI Sam Altman však již dříve upozornil, že aktuální testovací model má zatím slabiny, například může mít problémy s dodržením fyzikálních zákonů v komplexních scénách. Právě testy by ale měly ukázat na slabiny systému, aby je tvůrci mohli odstranit ještě předtím, než nový sytém umělé inteligence zpřístupní široké veřejnosti.
Kdy se tak stane, však zástupci společnosti OpenAI zatím neprozradili.
The OpenAI Sora team dropped more wild AI videos.
— Min Choi (@minchoi) February 18, 2024
100% AI 🤯
1. Cybernetic German Shepherdpic.twitter.com/ZSs7NvBEwq
More mind blowing Sora videos from the OpenAI team
— Min Choi (@minchoi) February 20, 2024
1. Flower tigerpic.twitter.com/j6gxR95qFP
Obavy o práci a dezinformace
Tyto inovace otevírají brány pro nové možnosti ve světě digitálního obsahu, ale zároveň vyvolávají otázky týkající se etiky a bezpečnosti. Existují obavy, že by tato technologie mohla negativně ovlivnit trh práce pro umělce a tvůrce obsahu tím, že zjednoduší a zautomatizuje proces tvorby videí. Dalším rizikem je potenciální zneužití v šíření dezinformací a falešných zpráv, což představuje výzvu pro regulátory a společnost jako celek.
Proto i samotní tvůrci umělé inteligence volají po zavedení jasných norem, které zajistí bezpečné využití pokročilých technologií. Společnost OpenAI je jedním z předních hráčů, kteří se snaží formovat diskusi, a to nejen prostřednictvím svých technologií, ale také otevřeným dialogem s veřejností a regulátory.
Fenomén jménem ChatGPT
Umělá inteligence se dostala do středu pozornosti s rozvojem ChatGPT. Tento chatovací systém dokáže generovat různé texty včetně článků, esejí, vtipů a poezie na základě jednoduchých dotazů. ChatGPT se učí odpovídat na podněty uživatelů a podobně jako lidé se učí na základě velkého množství dat.
V květnu 2024 byl zpřístupněn pokročilejší model umělé inteligence GPT-4o. Ten je schopen poskytovat bezpečnější a užitečnější odpovědi a připravit půdu pro šíření technologií podobných lidem. Zvládá simulovat i emoce.
Webovou aplikaci nabízí OpenAI zdarma, v placené verzi ale můžete systém využívat i ve chvíli, kdy je velmi zatížen. Ostatní musí čekat na uvolnění kapacity. Předplatné, které nabízí i další výhody, vyjde případné zájemce na 20 dolarů měsíčně, tedy v přepočtu zhruba na 470 Kč.
Za ChatGPT stojí start-up OpenAI, který financuje společnost Microsoft.