Aplikace od Microsoftu vám popíše obrázky detailněji než kdy dříve

Dan Otta
  • Seeing AI je aplikace, která skrze chytrý telefon popisuje nevidomým svět kolem nich
  • Nový algoritmus nyní umožňuje mnohem přesnější popis fotografií
  • Do budoucna se chystá integrace tohoto řešení i do dalších služeb využívajících Azure AI
Nevidomý člověk
Nevidomý člověk

V dnešní době, kdy se stále více každodenních záležitostí řeší skrze internet a elektronická zařízení stavěná na práci s textem a obrazem, se může zdát zapojení nevidomých do normálního života zapeklitým problém. Naštěstí to na druhé straně vyvažuje rozvoj hlasových asistentů a různých programů, které předčítají obsah na displeji. Jednou takovou pomůckou pro nevidomé je i aplikace Seeing AI od Microsoftu. Ta umožňuje využít fotoaparát chytrého telefonu jako náhradní oči, kde obraz poté vyhodnotí dle zvoleného režimu algoritmus a pokusí se co nejlépe popisovat, co vidí. Umí dokonce i takové věci jako odhadnout barvy, náladu lidí kolem nebo třeba navést nevidomého ke správnému načtení QR kódu. Také se snaží popisovat nasnímané obrázky a fotografie, výsledky však dosud nebyly vždy zcela uspokojivé.

Táborák na pláži nebo muž při západu?

To se nyní za pomocí strojového učení mění a popis by tak měl být mnohem přesnější. Kde by dříve u fotografie jen zhruba odhadla zachycenou scénu, často navíc zcela mylně, dokáže nyní popsat i souvislosti a jemnější detaily. Jeden z uváděných příkladů je třeba fotografie, kde byl původní popis „kočka vyfocená z blízka“, zatímco nový algoritmus již říká mnohem výstižněji „šedá kočka zavírající oči“. Někdy se v minulosti popisek minul úplně, kdy třeba ve fotografii ohníčku na pláži viděl sedícího muže, který tam vůbec nebyl. Tvůrci dodávají, že v ideálním případě by byl každý obrázek už rovnou opatřený správným popiskem od svého autora, realita je ovšem jiná, a tak je třeba tyto věci automatizovat. Snadno si lze představit, jaký přínos mohou mít správné popisky dění na fotografiích například pro nevidomé, kteří se snaží držet krok se svými blízkými skrze sociální sítě.

Seeing AI je v současné době dostupná pouze pro zařízení s iOS, navíc bez podpory češtiny, časem se snad dočká ale rozšíření i pro další platformy a jazykové variace. Microsoft navíc plánuje využít vylepšené rozpoznávání obrázků i v širším rámci ekosystému svých služeb. Do konce roku ho chce využít pro asistenci při používání aplikací Microsoft Word, PowerPoint, Outlook a i pro samotné Windows. Rovněž ho zpřístupňuje v rámci své platformy Azure AI, kde ho mohou využít ostatní vývojáři pro vlastní služby.


Autor článku

Dan Otta - Redaktor

Bývalý redaktor webu Inteligentnisvet.cz.


Komentáře


Nejnovější články