Meta driver Superintelligenslaboratorier med beräkningskraft som flaskhals, långa träningskörningar planeras tio månader i förväg och små rörliga forskarlag jagar nästa modell före tidsfönstret, den som får igenom nästa körning styr mer än den som skriver dokumentation och säkerhetsarbete blir vad som hinner mätas innan nästa version gör det irrelevant

Bilder

Prakhar Agarwal shares what life inside top AI labs is like and the lessons he's learned. Prakhar Agarwal businessinsider.com

Metas nya ”laboratorier för övermänsklig intelligens” styrs av en enkel begränsning: det är inte antalet anställda som sätter takten, utan tillgången till beräkningskraft. I en återberättad text för Business Insider beskriver den tillämpade forskaren Prakhar Agarwal hur arbetets rytm formas av långa träningskörningar och förstärkningsinlärning, ofta planerade omkring tio månader i förväg, följt av intensiva slutspurter när lagen tävlar om att få ut nästa version av modellen.

Agarwals skildring liknar mindre ett vanligt organisationsschema i ett storföretag och mer en liten verkstad där allt hänger på en knapp resurs. När tiden på grafikprocessorer är begränsad slutar den vanliga företagslösningen – att anställa fler och stycka upp arbetet – att fungera, menar han, eftersom fler personer bara späder ut just den resurs alla behöver för att komma framåt. Resultatet blir en plattare struktur, tätare kommunikation och en ”flytande” definition av lag: forskare samarbetar över gränser beroende på problem, inte efter rapporteringskedja.

Detta får följdverkningar som märks även utanför Metas väggar. Om den verkliga flaskhalsen är beräkningskraft tenderar intern status att följa den som kan motivera att få använda de knappa körningarna, inte den som skriver mest dokumentation eller driver mest process. Agarwal säger att mycket arbete inte dokumenteras och att koden förändras snabbare än beskrivningarna, vilket tvingar forskare till direkt ”kodarkeologi” och snabb omprövning. I praktiken gynnar det personer som snabbt kan gå från ”modellen misslyckas med X” till en ändring som förbättrar den aktuella versionen innan nästa träningscykel kommer och eventuellt förändrar själva problemet.

Det formar också hur ”säkerhet” ser ut i vardagen. Enligt Agarwal ägnar lagen, när de är längre från en träningsfrist, tid åt utvärderingar – att leta felbeteenden i befintliga system. Men grundrytmen är fortfarande leveransdriven: missar en åtgärd tidsfönstret kan nästa modellversion göra arbetet irrelevant. Det skapar en inbyggd snedvridning mot ingrepp som snabbt kan prövas mot dagens modell, snarare än långsammare arbete som först betalar sig när systemen väl används och möter röriga incitament i verkligheten.

Agarwal lyfter en mindre synlig fördel: de ledande laboratorierna samlar kunskap om vad som inte fungerar. Vetenskapliga artiklar redovisar det framgångsrika receptet, noterar han, men inte de dussintals återvändsgränder som prövats innan; de interna grupperna behåller den negativa kunskapen och bygger ”intuition” av den. Det är en konkurrensfördel – men också ett styrningsproblem, eftersom utomstående som bedömer säkerhetspåståenden mest ser de publicerade framgångarna, inte den interna katalogen av misslyckanden som avgör vad laboratoriet försöker härnäst.

Meta bygger därmed en institution vars främsta knappa insatsfaktor inte är talang utan maskintid. Den mest konkreta lärdomen i texten är att den som vill påverka utfallet i en sådan miljö i praktiken måste påverka nästa körning – vem som får den, och vad den används till.