Media

Appar betalar folk för att spela in privatlivet åt träningsdata till artificiell intelligens

Neon Mobile och Kled AI köper samtal texter och omgivningsljud när gratis nätdata tar slut och bolagen jagar mänsklig vardagskontext, engångsersättning till säljaren men bestående risk för identitetsstöld utpressning och kopierbar röst där kostnaden hamnar hos individen

Bilder

Silicon Valley’s hunger for human-grade data has given rise to a thriving industry of data marketplaces. Illustration: Guardian Design/Getty Images Silicon Valley’s hunger for human-grade data has given rise to a thriving industry of data marketplaces. Illustration: Guardian Design/Getty Images theguardian.com
Gig AI trainers, who upload everything from scenes around them to photos, videos, and audio of themselves, are at the frontlines of a new global data gold rush. Photograph: Arun Sankar/AFP via Getty Images Gig AI trainers, who upload everything from scenes around them to photos, videos, and audio of themselves, are at the frontlines of a new global data gold rush. Photograph: Arun Sankar/AFP via Getty Images theguardian.com
Cape Town, South Africa. Photograph: Peter Titmuss/Universal Images Group/Getty Images Cape Town, South Africa. Photograph: Peter Titmuss/Universal Images Group/Getty Images theguardian.com

Allt fler människor får betalt för att sälja små bitar av sitt privatliv till företag som tränar nästa generation av artificiell intelligens. En svetslärling i Chicago säger att han tjänade några hundra dollar genom att låta en app spela in hans privata telefonsamtal för 50 cent per minut. I Kapstaden fick en 27-åring 14 dollar för att filma sin dagliga promenad till en datamängd för ”stadsnavigering”. Enligt The Guardian betalar plattformar som Neon Mobile, Kled AI och Silencio tusentals personer för att lämna ifrån sig fragment av vardagen – textmeddelanden, samtal, bakgrundsljud, fotografier och filmklipp – som råvara till nya modeller.

Säljargumentet är rakt: den ”gratis” träningsdata som länge kunnat hämtas från nätet blir svårare att skrapa ihop. Utgivare begränsar åtkomst och de bästa offentliga datamängderna är redan hårt utnyttjade. The Guardian hänvisar till bedömningar om att högkvalitativ text som duger för träning kan börja sina redan 2026. Då återstår alternativ som antingen försämrar resultaten – självgenererade dataloopar som urholkar kvaliteten – eller betald data av ”mänsklig” sort, med verklig kontext. Datamarknadsplatserna fyller luckan genom att göra vardagslivet till en leveranskedja: mikrouppdrag, minutpriser och extra ersättning för det ovanliga, som en hotellfoajé, ett visst gatuhörn eller en särskild accent.

Den ekonomiska överenskommelsen är sned. Köparen får ett varaktigt träningsvärde – röst, manér, platsledtrådar, sociala relationer – medan säljaren får en engångssumma och behåller riskerna över tid. När ett röstprov eller en samtalshistorik väl matats in kan det kopieras, kombineras och användas på sätt som bidragsgivaren inte kan granska. The Guardian nämner farhågor från falska filmer och identitetsstöld till uthängningar och utpressning, men plattformarnas kärnfördel är att följdkostnaderna hamnar hos individerna, inte hos marknadsplatsen eller laboratoriet som tränar modellerna. Själva beslutet att delta beskrivs ofta som uppgivenhet: vissa säger till tidningen att de utgår från att teknikföretag ändå samlar in deras data, så de kan lika gärna få betalt.

Upplägget påminner om ett äldre mönster på nätet där användare varit obetalda producenter, men varan har förskjutits från inlägg och bilder till biometrisk identitet och privat umgänge. Sociala plattformar tjänade pengar på uppmärksamhet och sköt över kostnader för moderering, trakasserier och anseendeskador på användarna; här tjänar marknadsplatserna pengar på intimitet och skjuter över integritets- och säkerhetsrisker på dem som levererar råvaran. Att detta kläs i ”tillfälliga uppdrag” är också betydelsefullt: bidragsgivarna är inte anställda med förhandlingsstyrka, försäkringar eller verkställbara gränser för återanvändning. De är leverantörer på en marknad där köparen sätter villkoren och produkten kan kopieras obegränsat.

Den mest konkreta detaljen i The Guardians rapportering är också den mest avslöjande: en tonåring som säljer samtal med familj och vänner minut för minut. Affären är avslutad när ersättningen betalats ut, men datan tar inte slut där.