Google šlápl vedle! Dechberoucí videoukázka schopností AI Gemini byla podvrh

Video k nedávnému představení modelu AI Gemini předvedlo působivé schopnosti AI
Google však pro ukázku použil statické snímky a psané textové výzvy místo mluvených
Google připustil, že video nepředvádělo plynulou konverzaci s Gemini v reálném čase

Takto odpověděl model na obrazový podnět a otázku, které auto bude rychlejší na základě své aerodynamiky

Google nedávno představil Gemini, výkonnou sadu modelů umělé inteligence, ale kontroverze se již objevily kvůli ukázce, která byla údajně zkreslená. V praktickém videu během oznámení Gemini předvedlo své multimodální schopnosti, včetně mluvených konverzačních výzev v kombinaci s rozpoznáváním obrazu. Video prokázalo působivé rozpoznání a doby odezvy, což diváky nechalo v úžasu nad schopnostmi AI.

Video s AI Gemini neodpovídá realitě

Nicméně, op-ed z agentury Bloomberg kritizuje Google za klamání diváků. Popis videa na YouTube obsahuje prohlášení o vyloučení odpovědnosti: „Pro účely této ukázky byla snížena latence a výstupy Gemini byly zkráceny kvůli stručnosti.“ Problém podle sloupkařky Bloomberg Parmy Olson spočívá v tom, že Google pro ukázku použil statické snímky z nezpracovaných záběrů a psané textové výzvy místo mluvených výzev v reálném čase. Google to při dotazování uznal a připustil, že video nepředvádělo plynulou konverzaci s Gemini v reálném čase, jak se zdálo.

Olson naznačuje, že záměrem Googlu by mohlo být předvedení a odvedení pozornosti od skutečnosti, že Gemini zaostává za GPT OpenAI, jak informuje server The Verge. I když není neobvyklé, že společnosti upravují ukázková videa, aby se vyhnuly technickým zádrhelům, Google v minulosti čelil skepticismu ohledně pravosti svých ukázek. Ukázka Google Duplex, hlasového asistenta AI, který provádí rezervace v restauraci, vyvolala otázky kvůli absenci okolního hluku a příliš ochotných zaměstnanců.

Čtěte také: 17 fotek. Poznáte, které z nich jsou pravé a které vytvořila umělá inteligence?

Konkureční boj Googlu s OpenAI

Google obhajoval ukázku Gemini a tvrdil, že všechny uživatelské výzvy a výstupy ve videu byly skutečné, ale kvůli stručnosti byly zkráceny. Oriol Vinyals, viceprezident pro výzkum a hluboké učení ve společnosti Google DeepMind a spoluvedoucí pro Gemini, vysvětlil, že cílem videa je ilustrovat multimodální uživatelské zkušenosti vytvořené s Gemini a inspirovat vývojáře.

Olson však namítá, že přístup Google nemusí být správný, zvláště když společnost čelí konkurenci OpenAI. Namísto pečlivě upravovaných videí navrhuje, aby Google umožnil novinářům a vývojářům vyzkoušet si produkt přímo, možná prostřednictvím malé veřejné beta verze. To by podle ní poskytlo přesnější a transparentnější reprezentaci schopností Gemini a efektivněji inspirovalo vývojáře.