Sverige behöver entreprenörer som förstår vart tekniken är på väg. Vi behöver också en affärsvärld och ett samhälle som är redo för förändring. Tekniken ligger redan långt före de produkter och tjänster de möjliggör och försprånget bara ökar.
David Fendrich, CTO Tenfifty. Foto: Press/iStock – Breakit

I slutet på november förra året släppte OpenAI sin chattbot ChatGPT till allmänheten. Chattbotten blev ett internetfenomen och den nådde, som första applikation någonsin, en miljon användare på fem dagar. ChatGPT uppvisar en sådan förståelse i fritext-konversation att många tycker att svaren redan är svåra att skilja från en människas  det så kallade Turingtestet. I kölvattnet av detta har vi under de två senaste månaderna sett imponerande resultat från fler språkmodeller baserade på samma transformerteknik tränad på enorma mängder text och förstärkt med mänsklig feedback.

DeepMinds medicinska språkmodell, MedPaLM, svarar i en studie publicerad i december nästan lika bra som läkare på medicinska frågor. Anthropics GPT-konkurrent Claude klarade för någon vecka sedan både ett juridikprov och ett ekonomiprov på universitetsnivå. Det är rimligt att fråga sig hur mycket av detta som är hype när detaljerna synas och vart vi egentligen är på väg.

ChatGPT är inte den första botten som får folk att tappa hakan, men det är den första som är publikt tillgänglig. Redan i juni förra året blev det en världsnyhet när Google-ingenjören Blake Lemoine hävdade att deras chattbot LaMDA 2 var självmedveten och hade en sjuårings intelligens. Google, stödda av resten av AI-världen, dementerade snabbt detta och avskedade snart därpå den excentriske Lemoine. Google har varit mycket försiktiga med sin AI-forskning och endast vågat släppa högst begränsade och ganska tråkiga teknikdemonstrationer. Något av det mest imponerande jag sett är Google-ägda DeepMinds visuella språkmodell Flamingo, som i konversationer kan uppvisa djup förståelse kring bilder och videos. Dessa resultat begravdes dock i en forskningsartikel i PDF-format – en stark kontrast mot hur OpenAI bedriver sin forskning och PR.

“ChatGPT är inte den första botten som får folk att tappa hakan, men det är den första som är publikt tillgänglig”

Allt talar dock för att detta nu kommer förändras, eftersom Google strax före jul signalerat intern “kod röd” och planerar att integrera en mängd AI-produkter i sina tjänster under det kommande året, för att möta konkurrenshotet från mer snabbfotade företag. Ett av dessa hot kommer från Microsoft, som har ett tätt samarbete med OpenAI och just nu jobbar på att få in deras teknik både i Office-produkterna och sin söktjänst Bing.

Text är inte det enda område som ser en rasande utveckling. De generativa bildmodellerna som kan skapa konst, illustrationer och fotografier från text-beskrivningar har gått från att vara rolig kuriosa för ett år sedan till att få en hel industri att känna sig både upprörd och hotad de senaste månaderna. På samma sätt har programmeringsstöd från bland annat GitHubs Copilot nått produktivitetshöjande nivåer och resulterat i liknande upphovsrättsliga frågor. Generering av video, musik och 3D-modeller står näst på tur. Whisper, OpenAIs öppna modell för ljud-till-text, nådde i höstas generell mänsklig nivå på sin förståelse av otydligt och starkt dialektalt tal.

“Nästan alla yrkesroller som konsumerar och producerar kunskap med text som medium nu kan effektiviseras med AI, men nästan inget kan helt ersättas”

Teknisk populärdiskurs kompliceras av behovet att samtidigt kommunicera två koncept. Var är vi just nu och vart är vi på väg? De stora språkmodellerna är i dag på en nivå där allt de skriver måste verifieras. Modellerna är väldigt övertygande, oavsett om de vet vad de skriver om eller inte. Detta är ett av skälen till att nästan alla yrkesroller som konsumerar och producerar kunskap med text som medium nu kan effektiviseras med AI, men nästan inget kan helt ersättas. Så kommer det med all sannolikhet vara ett tag framöver –- det är mycket enklare att ge en människa besluts- och produktivitetsstöd än att robust klara alla udda situationer som kan uppstå.

Ett typexempel på detta fenomen är självkörande fordon, där det visat sig överkomligt att större delen av tiden köra bättre och säkrare än en människa, men nästan omöjligt att göra det i alla situationer. På Tenfifty har vi i många år hjälpt företag med AI-projekt och folk är ibland nervösa för att bli ersatta, men i praktiken handlar dessa lösningar nästan alltid om beslutsstöd, där en AI stödjer och förstärker en människa.

Men vart är vi på väg? ChatGPT är byggd ovanpå den generella språkmodell som kallas GPT3.5. Uppföljaren GPT4 existerar redan bakom slutna dörrar och kommer snart göras tillgänglig för en större skara, men de som förväntar sig ett revolutionerande skutt framåt kommer bli besvikna enligt OpenAIs grundare Sam Altman. Den kommer bara göra något redan bra ännu bättre. Det finns en uppsjö av saker som språkmodellerna ännu inte klarar. Å ena sidan är sjön stor nog att vi har att göra i många år framöver. Å andra sidan blir den märkbart mindre för varje kvartal som går och framstegen visar inga tecken på att avstanna. DeepMind planerar till exempel att snart släppa sin egen chattbot Sparrow, som bland annat kan ange sina källor.

“DeepMinds grundare Demis Hassabis manar nu till försiktighet och att vi bör försöka bromsa takten”

Chattbottar och andra generativa modeller är endast ett steg på vägen mot en allmän intelligens. Så som de är utformade i dag kan de endast svara direkt och spontant på frågor. De kan inte stanna och fundera, planera och omforma. De kan inte heller använda externa verktyg, som till exempel att skriva ett litet program och köra det eller söka på nätet. För att ta dessa steg behöver en AI bland annat kunna resonera om avvägningar i resursutnyttjande kontra värde i måluppfyllning. Som allt annat är detta på väg. Det är faktiskt så mycket på väg att DeepMinds grundare Demis Hassabis nu manar till försiktighet och att vi bör försöka bromsa takten.

Vad som sker nu är en mekanisering och automatisering av intelligens och kreativitet. OpenAI och deras konkurrenter siktar öppet på att nå total paritet med mänsklig intelligens och sedan gå bortom det. Det är svårt att se hur denna process inte blir det som präglar världen framöver. Tar du hänsyn till detta i dina personliga och professionella beslut? Sverige behöver entreprenörer som förstår vart tekniken är på väg. Vi behöver också en affärsvärld och ett samhälle som är redo för förändring. Tekniken ligger redan långt före de produkter och tjänster de möjliggör och försprånget bara ökar.

*Denna krönika är 100% ett resultat av mänskligt hantverk. Stöd din lokala människa.

DAVID FENDRICH, CTO Tenfifty

Denna artikeln är skriven av David Fendrich och publicerades ursprungligen på Breakit som en gästkrönika.

Author

David Fendrich
CTO
David Fendrich is our Chief Technical Officer and one of the founders of Tenfifty. He has been working with AI and data science for almost two decades, helping companies put cutting edge solutions into practical use.