I många år har vi i IT-världen pratat om trenden mot att företag blir mer datadrivna och hur verktyg kan underlätta detta. Men datadrivenhet är en lögn!

Data kan nämligen aldrig säga något på egen hand. Data är alltid stum! Vad som säger något är modeller ovanpå data. Modeller är förenklingar och förklaringar av hur världen fungerar, som i sin tur kan koppla data till förutsägelser, vilka i sin tur kan styra handlingar. De flesta av ett företags modeller är implicita och ligger i huvudet på människor, men fler och fler hamnar också i datorn i form av affärslogik, statistik, formler och AI-modeller.

Precis som att vi har haft en trend mot att skapa ordning på din data via Business Intelligence, så kommer vi behöva en trend mot att skapa ordning på våra modeller med en modellavdelning och en modern variant av statistikernas dröm om en Chief Probability Officer. I dag sköts modeller ofta ad hoc, men det finns stora värden att hämta i att samla både implicita och explicita modeller under ett tak.

Vilket beteende vill du förändra?

Den viktigaste frågan när vi samlar och modellerar data är slutmålet: Vilket beslut vill jag förbättra?
Det enda sättet att generera värde från data och modeller är att använda det för att agera annorlunda än du hade gjort utan dem, så hur planerar du att förändra dig?

Med analystrappan brukar vi förklara vilka steg man behöver ta för att nå en rådgivande preskriptiv analys. Oavsett om man planerar att ta alla steg med AI, så är det viktigt att börja tänka bakifrån – Vad ska förbättras i slutändan?

När du har valt vad du vill förbättra kommer vi till vår första modell. Vad är värdet på att förbättra ett visst beslut? En modellavdelning bör redan ha samlat schablonvärden på detta för de vanligaste förutsägelserna, prognoserna och besluten på ett företag. Hur ska du annars veta vad som är en rimlig budget för att skapa ett bättre beslutsunderlag? Hur ska du annars ha konkreta projektmål?

I ett kunduppdrag för GKN skulle vi förbättra lagerprognoser, bland annat för att bestämma hur stora lager (och därmed bundet kapital) som är rimligt. För att få ett schablonvärde över vad som är en värdefull förbättring, så kan vi göra en enkel modell (med påhittade siffror!):

Kostnad för bundet kapital: 10% per bunden krona och år
Totalt bundet kapital i snitt: 1 000 000 000 SEK
Värdet blir då 1 MSEK/år per procents minskning.
Våra investeringar har 3-års-horisont: 3 MSEK per procent.

Bundet kapital ställs rimligen mot risken av att ha ett för lågt lager, där faktorerna kan vara förlorad utebliven försäljning, eventuellt vite, förlorat goodwill-värde, etc.

Detta är naturligtvis förenklingar av världen, men det är så modeller fungerar. En förenkling är mycket bättre än inget! Ett företag som har officiella modeller kring saker som t.ex värde av nya kunder eller lagerstorlek kan ta snabbare och mer objektiva beslut. Om dessa modeller dessutom finns centralt åtkomliga i stället för i huvudet på ledningen eller en domänexpert (implicita modeller!), så kan de också användas som indata eller mål för mer detaljerade modeller för underavdelningar, t.ex för sälj-, produktion- eller marknadsavdelningen. Dessa avdelningar kan naturligtvis också ha övergripande modeller och mål som hierarkiskt kan användas i ännu mer detaljerade modeller, som t.ex värdet på upptid på en viss maskin.

Värdet av information

Precis som att det är svårt men viktigt att uppskatta värdet av förbättrade prognoser så är det viktigt att kunna uppskatta värdet på mer information. När det är svårt att veta något så är det lätt att ge upp och tänka ”jag har ingen aning”, men det är just när du inte har någon aning som varje datapunkt är värd som mest. Det kanske är uppenbart när man tänker på det, men vi verkar ha dålig intuition kring detta.

Låt oss säga att du överväger att erbjuda en förbättrad produktionsprognos för dina kunder. Vi har ingen aning om hur många kunder som är intresserade. 0% är lika troligt som 100%. Vi slår vad om det är fler än 50% av kunderna som är intresserade och jag får 100 kr om jag har rätt och du får 200 kr om jag har fel.

Ett dåligt vad för mig ☹.

Hur många kunder måste jag fråga för att jag ska ha nog med information för att gå med förväntad vinst?

Om jag verkligen inte vet något så räcker det att fråga en enda kund för att gå från 50% chans att gissa rätt till 75% chans. Det är nog för att det föreslagna vadet nu ska vara fördelaktigt för mig!

Allt som påverkar dig kan observeras och om det kan observeras kan det mätas. Du behöver inte mäta perfekt, din mätning behöver bara ge dig mer information än vad du hade från början. Den behöver bara öka sannolikheten att du ska välja rätt. Vi använder data för att öka kunskap, inte för att få perfekt kunskap. Detta gör att uppskattningar från människor också är mätningar. Speciellt värdefullt i osäkra situationer är uppskattningar av konfidensintervaller, vilket i sin tur kan leda till konfidensintervaller i resultaten.

Prediktiva modeller

En modell är en förklaring av hur data genererats eller hänger ihop. En modell är ett verktyg för att resonera givet data. En modell komprimerar nästan alltid data approximativt.

Här är några exempel på olika modelltyper:

  • Gruppering: ”Vi har följande tre typkunder”
  • Dimensionsreduktion eller datamodeller: ”Vi beskriver våra kunder med bransch, årsomsättning och omsättning hos oss”
  • Enkla matematiska samband: ”Varje förbättrad procentenhet i säljprognos är värd X kr”
  • Djupare samband: ”Givet följande faktorer uppskattar vi risk för kvalitetsproblem enligt följande formel/algoritm, vilket i detta fall ger p%”
  • Även avsaknad av samband: ”Väder påverkar inte vår produktionstakt”

Specifikt försöker en prediktiv modell förutsäga framtiden. Givet vad vi vet, vad kommer hända? ”Framtiden” i detta fall kan vara om en millisekund eller om ett år. ”Djupare samband”, ovan, har ett exempel på en prediktiv modell.

I AI-världen kallar vi en katalog med färdiga modeller för ett modellzoo. Ett företag kan i sitt modellzoo ha saker som kundvärde, prognoser på efterfrågan, punktlighet på underleverantörer, produktionstakt givet olika parametrar och kostnad för temporärt ökad produktionstakt.

Handling!

Prediktiva modeller förutsäger vad som kommer hända, men säger inte direkt hur du bör agera. En handlingsmodell (eller preskriptiv modell) svarar på hur du bör agera. En handlingsmodell svarar på detta genom att modellera samband mellan interna utfall och ett mål (t.ex intäkt). I praktiken bygger man ofta detta på flera prediktiva modeller, som tillsammans ger en bättre helhetsbild.

Ibland kör man en handlingsmodell rakt av (”vilken annons ska vi visa för denna användare?”), men ibland har man tid och anledning att simulera många steg framåt. ”Om jag börjar producera A i min fabrik nu och sedan gör B, etc, så är det X% risk att jag får en flaskhals senare i processen”.

Preskriptiva modeller kan agera självständigt, men de är ofta välanpassade för en människa att samarbeta med. Ibland har en handling mer långsiktiga effekter som dina modeller kanske inte tar med (”om vi sänker priserna för mycket driver vi ned marknadspriserna i vår bransch”). Ibland vet människan saker som modellen inte vet (”ett nytt skepp har fastnat i Suezkanalen”).

En användare bör veta vad en modell tar hänsyn till, för att veta när det är rimligt att avvika. Därför är det bra om en modell kan förklara hur den tänker och om den kan säga hur säker den är. Samarbete är ett tryggt första steg för att våga automatisera mer senare. Notera till exempel hur det går till när bilar gradvis blir mer självkörande.

Sammanfattningsvis

Företag bör och kommer röra sig mot att explicit:

  • Införa standardisering av modeller.
  • Skapa modeller på olika detaljnivåer.
  • Skapa modeller för kommunikation mellan avdelningar.
  • Skapa modeller för kommunikation med andra företag.
  • Bygga både strategiskt och operativt agerande med dessa modeller som beslutsunderlag.
  • Skapa en avdelning och en Chief Probability Officer för att underhålla sitt modellzoo.

Många branscher har redan börjat denna resa. Vinsten på att modellera bättre är ofta linjär med avseende på företagsstorlek. Man drar bort procent från utgifter eller lägger på procent på vinst. Kostnaden för att modellera bättre är förvisso högre för ett större företag, men denna kostnad skalar mycket långsammare – förmodligen växer den logaritmiskt.

Därför ökar generellt vikten av ett välskött modellzoo ju större ett företag är!

Author

David Fendrich
CTO
David Fendrich is our Chief Technical Officer and one of the founders of Tenfifty. He has been working with AI and data science for almost two decades, helping companies put cutting edge solutions into practical use.