Umělá inteligence se naučila nový kousek. Dokáže rozezpívat jakoukoliv fotku
- Všichni víme, že AI umí vytvářet dobrá videa
- Nyní se umělá inteligence naučila nový kousek
- Dokáže rozpovídat jakoukoliv fotku

Umělá inteligence dokáže psát skvělé texty, generovat realistická videa či obrázky a nyní se naučila další novou schopnost. Nově dokáže rozezpívat a rozmluvit jakoukoliv fotku, a výsledky jsou velmi slibné.
Nový AI model na scéně
Tentokrát se nejedná o nic z dílen OpenAI, ale o projekt čínských vědců ze společnosti Alibaba. Ta vlastní například populární internetové tržiště AliExpress, takže peněz na financování různých projektů má dost. Nový model se jmenuje EMO a dokáže rozmluvit nebo rozpovídat jakoukoliv fotku.
Stačí přitom poskytnout jen jednu fotku a jednu zvukovou stopu, kde člověk mluví. Model následně vygeneruje video, na kterém osoba z fotky buď mluví nebo zpívá, a výsledek je velmi věrohodný.

Čtěte také: Sociální síť TikTok může dostat za mořem stopku. Existuje zřejmě jediné řešení
Jak to funguje?
Model je natrénovaný tak, aby dokázal efektivně naskenovat rysy v obličeji a ty poté zreplikovat v dalších vytvořených snímcích. Model si tedy sám dopočítá, jak by měla vypadat mimika pro jakýkoliv obličej, a následně složí více vytvořených snímků dohromady.
V další fázi EMO vygeneruje pomocí syntetizátoru hlasu odpovídající řeč anebo zpěv. Poslední fáze je vše synchronizovat, aby řeč i mimika v obličeji skutečně odpovídala tomu, jak to má vypadat. Vše je nutné sjednotit s milisekundovou přesností.
Funkce je zatím jen experimentální
V současné době není způsob, jak si model EMO vyzkoušet, ale je možné, že v budoucnu ho vývojáři zpřístupní. Na této stránce můžete najít další informace o tom, jak model funguje a co dokáže.
Ukázka toho, co model EMO zvládne
https://youtu.be/VlJ71kzcn9Y?si=Tb6sFW4ZO_2KErNg
Autor článku

Od útlého věku se zajímám o počítače, mobily a vůbec o vše, co má jakoukoli chytrou funkcionalitu. Přísun novinek z technologické sféry je pro mě pořádná dávka dopaminu! Svůj volný čas věnuji především hraní her, sledování kvalitních seriálů či filmů nebo pobytu v přírodě, ať už túrami nebo jízdou na elektrokole.
Od útlého věku se zajímám o počítače, mobily a vůbec o vše, co má jakoukoli chytrou funkcionalitu. Přísun novinek z technologické sféry je pro mě pořádná dávka dopaminu! Svůj volný čas věnuji především hraní her, sledování kvalitních seriálů či filmů nebo pobytu v přírodě, ať už túrami nebo jízdou na elektrokole.