Bude lepší než Sora? Čínský AI video nástroj Vidu trvdí, že jí může konkurovat

3. 5. 2024 | Petr Michl
Další rival Sory od OpenAI přichází z východu. Podívejte se na video ukázku jeho schopností.


Tvorba videa na základě textového zadání je v tomto roce sférou, kde dělá umělá inteligence největší pokroky. Nyní tu je vyzyvatel z Číny, který tvrdí, že dokáže směle konkurovat i AI video nástroji Sora od OpenAI.

Za nástrojem, který nese název Vidu, stojí společnost Shengshu Technology a Tsinghua University. Nástroj dokáže po zadání textového promptu vytvořit až 16sekundový klip ve FullHD rozlišení, kvalita ve smyslu fotorealističnosti se přitom skutečně blíží ukázce, s kterou ohromila svět Sora.

Shengshu Technology je univerzitním spin-offem, kdy je jeho hlavním inovátorem zároveň děkanem Institutu pro AI. V Číně neexistuje taková akademická svoboda a stát dokáže univerzitám nařídit, co má být hlavním směrem jejich bádání. U mnoha technických univerzit byla určeným směrem umělá inteligence. Je tak svým způsobem překvapivé, že Čína dosud není tak výrazným hybatelem dění v dané oblasti. Zejména ve sféře AI videa ji brzdí například americký omezení na vývoz grafických karet Nvidia A100 a H100. Neznamená to ale rozhodně, že na AI modelech nepracují.

Vidu je založen na architektuře Universal Vision Transformer (U-ViT), která podle společnosti umožňuje   generovat pohledy z více kamer a simulovat skutečný fyzický svět. Tato architektura byla údajně vyvinuta týmem Shengshu Technology v září 2022, a měla by být tak mladší než architektura difuzního transformátoru (DiT), kterou používá Sora.

Hry na rodný list nejsou podstatné. Rozdílem je to, že Sora má být schopna vytvářet až minutová videa, tedy téměř čtyřnásobnou stopáž ve srovnání s Vidu. Zároveň ukázka od Vidu na Soru ztrácí něco v detailech video výstupu. Porovnání je nicméně obtížné z showcase videí. Skutečný výkon ověřený velkým množstvím uživatelů není v tuto chvíli známý ani u nástroje Sora, který je stále sdílen OpenAI v testovací fázi jen s vybranými tvůrci. Leccos ale naznačují výstupy od těch vyvolených. Mezi ně patří i Paul Trillo, který vytvořil s pomocí Sory také včera vydaný videoklip pro skupinu Washed Out. Využívá techniku „nekonečného průletu“ a to, v čem je AI silná: seká krátké úseky z velkého množství prostředí.

Shengshu Technology má značné kapitálové krytí od tamních fondů velkých technologických společností, Qiming Ventures, Zhipu AI d Baidu Ventures. Svůj model prý také vyvíjí Alibaba. AI video závod není ani zdaleka u konce a čínští hráči v něm budou čím dál více kousat.

Zdroje: Paul Trillo, smcp, technode, weixin

Tip redakce

Ty nejschopnější AI video nástroje jsou aktuálně dostupné jen omezenému počtu uživatelů. Podívejte se na jejich příslib v článcích:

Je tu gamechanger? AI video nástroj Sora od OpenAI přináší dosud neviděnou kvalitu

Dosud největší příslib pro AI video. LTX Studio nabídne bezprecedentní možnosti nastavení při tvorbě

Štítky dokumentu: AI

To nejlepší z moderního marketingu každý pátek do vašeho inboxu.

Ochrana proti spamovacím robotům. Odpovězte prosím na následující otázku: Jaký je letos rok?
Podobné články: