Vetenskap

Robotmodell påstås klara nya uppgifter utan omträning

Physical Intelligence kombinerar förträning på webben med robotdemonstrationer och låter personal styra med talade instruktioner, i testet avgör en halvtimmes omformulering av kommandon om roboten lyckas

Bilder

Image Credits:Physical Intelligence Image Credits:Physical Intelligence Image Credits:Physical Intelligence
Connie Loizos Connie Loizos techcrunch.com

Det nya i den senaste vågen av robotik handlar mindre om starkare motorer och mer om vem som gör anpassningsarbetet. Det San Francisco-baserade uppstartsbolaget Physical Intelligence, grundat för två år sedan, hävdar enligt TechCrunch att deras nya modell π0.7 kan styra robotar i uppgifter den inte uttryckligen tränats för. Modellen beskrivs som ett tidigt ”robot-hjärna för allmänna ändamål”, där man i stället för att träna om systemet för varje ny uppgift ska kunna leda det genom okänd arbetsgång med vanliga talade instruktioner.

Bolagets centrala belägg är det de kallar sammansättande generalisering: att återkombinera färdigheter som lärts in i skilda sammanhang för att lösa ett nytt problem. I en demonstration fick en robot hantera en varmluftsfritös, en apparat som enligt bolaget bara förekom två gånger i träningsmaterialet. I det ena fallet visades en annan robot som tryckte igen varmluftsfritösen. I det andra, hämtat ur en fritt tillgänglig datamängd, visades en robot som på kommando lade en plastflaska inuti. π0.7 ska därefter, med hjälp av dessa fragment och mer omfattande förträning, ha försökt tillaga en sötpotatis och blivit bättre när en människa gav muntlig vägledning steg för steg.

Detta placeras i en trång kapplöpning att ta robotar bortom industrins klassiska styrka: repetitiva moment i hårt kontrollerade miljöer. Robotiklaboratorier och företag har länge lutat sig mot uppgiftsspecifika datamängder: samla demonstrationer för ”öppna den här lådan”, träna en styrning, och börja om för ”plocka upp den här muggen”. Physical Intelligence menar att om en modell kan blanda om redan inlärda byggstenar, så skalar prestationen bättre när man tillför mer data – en parallell till språnget när språkmodeller började klara fler sorters uppmaningar.

Men samma upplägg som möjliggör snabb utveckling flyttar också ansvar till den som står vid roboten. TechCrunch uppger att gruppen såg låg framgångsgrad i början på varmluftsfritös-uppgiften, och att den steg kraftigt först efter att man lagt tid på att skriva om instruktionerna. En forskare säger att felorsaken ofta var hur människor formulerade sig, snarare än robotens mekanik. Det pekar mot en nära förestående användningsmodell där robotar blir nyttigare inte genom att vara fullt självständiga, utan genom att ”coachas” av personal som lär sig hur man ska tala med dem. Det innebär ett nytt lager av arbete och internutbildning som lätt försvinner när demonstrationer klipps för att se friktionsfria ut.

Standardiserade prov är fortfarande en flaskhals. Robotresultat är ökända för att vara svåra att jämföra mellan laboratorier eftersom hårdvara skiljer sig, uppgifter är otydligt definierade och små miljöändringar kan vända utfallet. Utan gemensamma utvärderingssviter och oberoende upprepning blir påståenden om allmängiltighet svåra att värdera: en robot som kan lotsas genom en varmluftsfritössekvens kan ändå misslyckas när den får ett enda övergripande kommando som ”gör rostat bröd”, vilket bolaget självt medger.

Physical Intelligence säljer in att coachning kan sänka kostnaden för att sätta in robotar i nya miljöer genom att slippa återkommande cykler av datainsamling och omträning. Den omedelbara frågan är om vinsterna kommer av ett verkligt språng i robotens förmåga att resonera, eller av en mer jordnära förskjutning i vem som gör anpassningen: ingenjörer i laboratoriet eller anställda på plats.

I varmluftsfritösprovet ska skillnaden mellan misslyckande och framgång enligt uppgift ha handlat om ungefär en halvtimmes omskrivning av instruktionerna.