Umělá inteligence u složitějších úloh kolabuje. Pokrok není takový, jak se myslelo

Tomáš Rajnoch
Umělá inteligence vs člověk | foto: Insurance Chat
Umělá inteligence vs člověk | foto: Insurance Chat

Nový výzkum Applu ukazuje, že umělá inteligence často selhává u složitých úloh. Vývoj obecné AI je tak podle vědců dál, než se dříve myslelo.

Umělá inteligence často tápe

Odvětví umělé inteligence je extrémně progresivní a téměř každý den jsou v oblasti AI učiněny velké pokroky. Aktuálně však byla AI výzkumníky Applu podrobena testu, který zjistil, že umělá inteligence často chybuje.

Nový výzkum se jmenuje Iluze myšlení a zaměřuje se především na běžné jazykové modely (LLM) a jazykové modely uvažování (LRM). Výzkum poté zjistil, že v řešení jednoduchých úkolů jsou na tom modely LLM výrazně lépe.

Pokud však byla AI postavena před složité úkony, selhaly běžné modely i ty určené pro samostatné uvažování. AI dokonce často kolabovala a neefektivně využívala výkon.

Umělá inteligence | foto: Great Learning
Umělá inteligence | foto: Great Learning

Obecná AI je ještě daleko

Cílem vývojářů AI je vyvinout takzvanou obecnou umělou inteligenci (AGI), která by se vyrovnala lidské inteligenci. Americký akademik Andrew Rogoyski však dodává, že dosažení takové inteligence je dále, než jsme si mysleli.

To ostatně dokazuje i ona studie od Applu. Tato studie poukázala na to, že pokud AI řeší složití problémy, rozloží je na menší části a řeší je samostatně. To je ale velmi náročný proces a pokud klesá výkon, je racionální myšlení AI zásadně ovlivněno.

U složitých problémů ztrácejí modely LRM přehled a problém často nedokážou vyřešit. U menší úloh je však efektivita hledání řešení poměrně dobrá. Současný přístup se nicméně podle akademika Garyho Markuse nachází ve slepé uličce.

Jak fungují moderní modely uvažování?

V oblasti umělé inteligence se dnes často používají rozsáhlé modely uvažování, které přinášejí přesnější odpovědi. Tento nový systém AI dokáže totiž tvořit myšlenkové mapy.

Díky tomu nabízí modely podrobný pohled na uvažování, čímž je pro uživatele zlepšena přehlednost. Modely jsou díky tomu srozumitelnější a méně náchylné k chybám.

Jaké modely Apple testoval?

Výzkumníci společnosti Apple pro vytvoření studie Iluze myšlení testovali pokročilé jazykové modely uvažování. Mezi ně patří OpenAI o3, Google Gemini Thinking, Anthropic Claude 3.7 Sonnet-Thinking a DeepSeek-R1.

Společnosti, jež za těmito jazyky umělé inteligence stojí, byly vyznány k reakci. Prozatím ale mlčí a na vyjádření k výsledkům studie čekáme.

Zdroje:


Autor článku

Tomáš Rajnoch - Redaktor

Tomáš se zajímá o technologie všeho druhu. Píše seriály o novinkách z Netflixu a dalších streamovacích služeb. Pracuje v elektrotechnice, ve volném čase rád cestuje a fandí fotbalu.


Komentáře


Nejnovější články