Media

Google släpper tyst gratis dikteringsapp för Iphone

Google AI Edge Eloquent skriver tal till redigerad text lokalt med Gemma och kan växla till Gemini i molnet för puts, integritetsargumentet följs av Gmail-import och pressar prenumerationsapparnas affärsmodell

Bilder

Image Credits:Screenshot by TechCrunch Image Credits:Screenshot by TechCrunch Image Credits:Screenshot by TechCrunch
I was saying “Transcription.” Still early days for this app.Image Credits:Screenshot by TechCrunch I was saying “Transcription.” Still early days for this app.Image Credits:Screenshot by TechCrunch Image Credits:Screenshot by TechCrunch

Google har i det tysta släppt en ny app för Iphone, Google AI Edge Eloquent, som gör om tal till redigerad text direkt i telefonen. Valet att låta taligenkänningen ske lokalt sätter integritet och snabbhet i centrum i en produktkategori som annars ofta bygger på molnbehandling. Appen är gratis att hämta och när dess Gemma-baserade modeller för automatisk taligenkänning väl är installerade kan den skriva ut tal i realtid utan att skicka ljudet från telefonen, enligt TechCrunch.

Lanseringen kommer i en marknad som vuxit snabbt i takt med att kvaliteten på tal-till-text förbättrats och ”diktering som arbetsflöde” blivit en prenumerationsvana. Nystartade bolag som Wispr Flow, SuperWhisper och Willow har sålt snabbhet och bekvämlighet; Googles inträde signalerar att storplattformarnas strategi kan vara att göra själva utskriftslagret till en billig standardvara, medan den verkliga betalningsviljan ska fångas högre upp: i textbearbetning och kopplingar till det egna ekosystemet.

Eloquents gränssnitt visar löpande utskrift och tar sedan automatiskt bort utfyllnadsord och självrättningar när användaren gör paus. Appen erbjuder också omskrivningslägen som ”Nyckelpunkter”, ”Formell”, ”Kort” och ”Lång”, vilket i praktiken gör rå diktering till ett första utkast. Här blir appens tudelade upplägg viktigt: användaren kan stänga av molnläge helt och hållet för enbart lokal behandling, men när molnläge är aktiverat använder appen Gemini-modeller för upprensning, rapporterar TechCrunch.

Appen erbjuder dessutom att hämta in namn, fackspråk och nyckelord från användarens Gmail-konto, ett val som visar hur ”lokalt först” ändå kan kombineras med databerikning. En lokal talmodell minskar behovet av att skicka ljud, men helhetsupplevelsen kan fortfarande formas av kontots omgivande nät: kontakter, ordförråd och användarens egna skrivmönster, om man samtycker.

Googles beskrivning i App Store hänvisade först till en version för Android med systemomfattande tangentbordsintegration och en flytande dikteringsknapp, liknande Wispr Flows funktion på Android. TechCrunch noterar att Google senare tog bort hänvisningarna till Android ur listningen och samtidigt lade till att ett tangentbord för Ios är ”på väg”, vilket antyder att Iphone-appen kan vara ett test inför en bredare utrullning.

För Apple-användare är den omedelbara konkurrensen mindre riktad mot Ios i sig – Apple levererar redan diktering och röstfunktioner – och mer mot fristående dikteringsverktyg som motiverar prenumerationspris med löften om integritet, snabbhet och ”bättre än standard”. En gratis Google-app som kan köras utan nätuppkoppling krymper det utrymmet, samtidigt som den frivilliga växeln till Gemini för putsning antyder var Google tror att ett mer svårkopierat värde ska ligga.

Google har inte presenterat lanseringen som någon stor produktnyhet. Än så länge är det en experimentapp med ett ovanligt tydligt budskap: talmodellen kan bo i telefonen, men affärsmodellen bor fortfarande i lagren ovanför.