Umělá inteligence se naučila nový kousek. Dokáže rozezpívat jakoukoliv fotku

Richard Šimáček
  • Všichni víme, že AI umí vytvářet dobrá videa
  • Nyní se umělá inteligence naučila nový kousek
  • Dokáže rozpovídat jakoukoliv fotku
Umělá inteligence a člověk Midjourney
Umělá inteligence a člověk Midjourney

Umělá inteligence dokáže psát skvělé texty, generovat realistická videa či obrázky a nyní se naučila další novou schopnost. Nově dokáže rozezpívat a rozmluvit jakoukoliv fotku, a výsledky jsou velmi slibné.

Nový AI model na scéně

Tentokrát se nejedná o nic z dílen OpenAI, ale o projekt čínských vědců ze společnosti Alibaba. Ta vlastní například populární internetové tržiště AliExpress, takže peněz na financování různých projektů má dost. Nový model se jmenuje EMO a dokáže rozmluvit nebo rozpovídat jakoukoliv fotku.

Stačí přitom poskytnout jen jednu fotku a jednu zvukovou stopu, kde člověk mluví. Model následně vygeneruje video, na kterém osoba z fotky buď mluví nebo zpívá, a výsledek je velmi věrohodný.

Model EMO
Model EMO

Čtěte také: Sociální síť TikTok může dostat za mořem stopku. Existuje zřejmě jediné řešení


Jak to funguje?

Model je natrénovaný tak, aby dokázal efektivně naskenovat rysy v obličeji a ty poté zreplikovat v dalších vytvořených snímcích. Model si tedy sám dopočítá, jak by měla vypadat mimika pro jakýkoliv obličej, a následně složí více vytvořených snímků dohromady.

V další fázi EMO vygeneruje pomocí syntetizátoru hlasu odpovídající řeč anebo zpěv. Poslední fáze je vše synchronizovat, aby řeč i mimika v obličeji skutečně odpovídala tomu, jak to má vypadat. Vše je nutné sjednotit s milisekundovou přesností.

Funkce je zatím jen experimentální

V současné době není způsob, jak si model EMO vyzkoušet, ale je možné, že v budoucnu ho vývojáři zpřístupní. Na této stránce můžete najít další informace o tom, jak model funguje a co dokáže.

Ukázka toho, co model EMO zvládne

https://youtu.be/VlJ71kzcn9Y?si=Tb6sFW4ZO_2KErNg

Sledujte nás v Google Zprávách

Autor článku

Richard Šimáček - Redaktor

Od útlého věku se zajímám o počítače, mobily a vůbec o vše, co má jakoukoli chytrou funkcionalitu. Přísun novinek z technologické sféry je pro mě pořádná dávka dopaminu! Svůj volný čas věnuji především hraní her, sledování kvalitních seriálů či filmů nebo pobytu v přírodě, ať už túrami nebo jízdou na elektrokole.


Komentáře


Nejnovější články