Microsoft pracuje na novém rozsáhlém jazykovém modelu AI nazvaném MAI-1, který by mohl konkurovat nejnovějším modelům od Googlu, Anthropic a OpenAI, podle zprávy společnosti Microsoft. Informace. Je to poprvé, co Microsoft vyvinul interní model umělé inteligence této velikosti od doby, kdy do OpenAI investoval více než 10 miliard dolarů za práva na opětovné použití modelů umělé inteligence startupu. OpenAI GPT-4 nepohání pouze ChatGPT, ale také Microsoft Copilot.

Vývoj MAI-1 vede Mustafa Soliman, bývalý vůdce Google AI, který naposledy působil jako generální ředitel AI startupu Inflection, než Microsoft v březnu získal většinu zaměstnanců a duševního vlastnictví startupu za 650 milionů dolarů. Ačkoli MAI-1 může být založen na technologiích, které přinesli bývalí zaměstnanci společnosti Inflection, jde prý o zcela nový model velkého jazyka (LLM), jak potvrdili dva zaměstnanci Microsoftu obeznámení s projektem.

S téměř 500 miliardami parametrů bude MAI-1 mnohem větší než předchozí open source modely Microsoftu (jako je Phi-3, kterým jsme se zabývali minulý měsíc), což bude vyžadovat větší výpočetní výkon a tréninková data. To prý řadí MAI-1 do podobné ligy jako GPT-4 od OpenAI, což je… Pověst Pro více než bilion parametrů (v mixu odborníků) a mnohem vyšší než menší modely, jako jsou modely Meta a Mistral se 70 miliardami parametrů.

reklama

Vývoj MAI-1 signalizuje duální přístup k AI v rámci Microsoftu se zaměřením na malé jazykové modely, které běží lokálně pro mobilní zařízení, a novější, větší modely, které běží v cloudu. Apple prý zkoumá podobný přístup. Zdůrazňuje také touhu společnosti prozkoumat vývoj AI nezávisle na OpenAI, jehož technologie v současnosti pohání nejambicióznější funkce AI společnosti Microsoft, včetně chatbota zabudovaného do Windows.

Přesný účel MAI-1 prý nebyl stanoven (ani v rámci Microsoftu) a jeho optimální využití bude podle jednoho informačního zdroje záviset na jeho výkonu. Pro trénování modelu vyčlenil Microsoft velký cluster serverů s GPU Nvidia a shromáždil tréninková data z různých zdrojů, včetně textu generovaného GPT-4 OpenAI a veřejných internetových dat.

V závislosti na pokroku v nadcházejících týdnech informace naznačují, že Microsoft by mohl zobrazit náhled MAI-1 již na konferenci Build Developer koncem tohoto měsíce, jak uvádí jeden ze zdrojů citovaných v příspěvku.