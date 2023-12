Gemini Ultra předvádí působivou ukázku oproti OpenAI GPT-4 na seznamu benchmarků, které testují schopnosti modelů AI. SOPA Images / Contributor / SOPA Images / Contributor

Google tento týden představil Gemini, svého konkurenta OpenAI GPT-4.

Google říká, že Gemini předčí GPT-4 v matematice, programování a znalostech předmětů na své nejpokročilejší úrovni.

Google také říká, že je to první model, který se srovnává s odborníky na lidské úrovni v testu v 57 tematických oblastech.

tento týden, Google odhalil znamení zvěrokruhu Blíženci , Což už zní jako děsivě chytrý konkurent OpenAI GPT-4.

Gemini se skládá ze tří různých modelů, které se liší velikostí a kapacitou. Jeho nejpokročilejší model, Gemini Ultra – který zatím není dostupný pro veřejnost, ale Google říká, že je navržen pro „vysoce složité úkoly“ – překonává chytrost. GPT-4 V několika oblastech, od znalostí témat, jako je historie a právo, přes vytváření kódu v Pythonu až po úkoly, které vyžadují vícestupňové myšlení, řekl Google, reklama .

Google to řekl Gemini překonali GPT-4 V masivním víceúkolovém testu porozumění jazyku nebo MMLU, což je jeden z nejoblíbenějších způsobů měření znalostí a dovedností při řešení problémů modelů AI.

Můžete to porovnat s „Akceptačními testy pro modely AI“ od Kevina Rose Řekl Na technologickém podcastu Hard Fork v New York Times. Test MMLU je však o něco pokročilejší než typický přípravný test na vysokou školu. Pokrývá 57 předmětů, včetně matematiky, fyziky, historie, práva, medicíny a etiky, k testování globálních znalostí a schopností řešit problémy, podle oznámení společnosti Google.

Gemini Ultra dosáhlo 90 % v MMLU, zatímco GPT-4 dosáhlo 86,4 %, podle Google.

Ale možná nejpůsobivějším úspěchem Gemini Ultra je to, že je to také první model, který překonal lidské experty z MMLU. Google v technické zprávě uvedl, že odborníci na lidi dosáhli asi 89,8 %. zpráva Na Blížencích.

„Myslím, že kdybyste se vrátili dokonce před dvěma nebo třemi lety a řekli výzkumníkům AI, že Google bude mít model, který bude mít 90 procent skóre na MMLU, je to lepší než standardní práh pro lidské experty, řekli by: Tak to je AGI,“ řekla Rose. AGI neboli umělá obecná inteligence je hypotetická forma umělé inteligence, která dokáže zpracovat složité lidské schopnosti, jako je zdravý rozum a vědomí.

GPT-4 porazil Gemini Ultra o několik procentních bodů v hodnocení rozumových schopností v každodenních úkolech, podle Google.

Ale jedna z výhod, kterou má podle Googlu Gemini oproti jiným modelům, je to, že je nativně multimediální, což znamená, že je od základu navrženo tak, aby zpracovávalo několik typů dat, od textu přes zvuk, kód až po obrázky a video. Další multimodální modely byly vytvořeny „sloučením“ pouze textových, pouze zrakových a zvukových modelů „neoptimálním způsobem,“ uvedl ve videu oznamující Gemini Oriol Viñales, viceprezident výzkumu společnosti Google DeepMind.

V důsledku toho Google říká, že design Gemini umožňuje porozumět vstupům lépe než současné multimediální modely. Stejně tak vědci za blogem SemiAnalogy Gemini pravděpodobně „rozdrtí“ GPT-4 Naprostý výpočetní výkon.

Zatímco Gemini Ultra má na svůj příchod jistě velká očekávání, porota stále neví, jak si trojité modely Gemini povedou proti OpenAI, která už má výhodu v povědomí spotřebitelů.

brzy Zpětná vazba na méně pokročilé Gemini Pro , ke kterému lze přistupovat prostřednictvím chatbota Google Bard, byl pozitivní. Model však měl také problémy s přesností a halucinacemi. Dokonce požádala lidi, aby to udělali Odpovědi na kontroverzní otázky získáte od Googlu .

Google a OpenAI nereagovaly na žádost o komentář od Business Insider.