Anonymní čtenář cituje zprávu z Ars Technica: Není pochyb o tom, že každý, kdo studoval základní informatiku, strávil čas vymýšlením třídícího algoritmu – kódu, který vezme neuspořádaný seznam položek a seřadí je vzestupně nebo sestupně. Je to zajímavá výzva, protože existuje tolik způsobů, jak to udělat, a protože lidé strávili spoustu času zjišťováním, jak toto třídění provést co nejefektivněji. Třídění je tak základní, že algoritmy jsou zabudovány do většiny standardních knihoven programovacích jazyků. A v případě knihovny C++ používané s kompilátorem LLVM nebyl kód za více než deset let zpracován.



Nyní však skupina DeepMind AI společnosti Google vyvinula nástroj pro výuku posílení Vysoce optimalizované algoritmy mohou být vyvinuty, aniž by byly nejprve školeny na příkladech lidského kódu. Trik byl připravit ho na to, aby s programováním zacházel jako s hrou. […] Systém AlphaDev vyvinul x86 kompilační algoritmy, které zacházely s latencí kódu jako s hitem a snažily se tento zásah minimalizovat a zároveň zajistit, aby kód běžel do dokončení bez chyb. Prostřednictvím posilovacího učení AlphaDev postupně rozvíjí schopnost psát vysoce efektivní a robustní kód. […]

Protože AlphaDev produkoval efektivnější kód, chtěl jej tým znovu začlenit do standardní knihovny C++ LLVM. Problém je v tom, že kód byl v assembleru spíše než C++. Museli tedy pracovat pozpátku a zjistit, který kód C++ vytvoří stejné sestavení. Jakmile to bylo hotovo, kód byl začleněn do LLVM toolchain – což bylo poprvé, kdy byly některé kódy upraveny za více než deset let. V důsledku toho vědci odhadli, že kód AlphaDev je nyní spouštěn bilionykrát denně. Hledání bylo Publikováno v časopise Nature.