Det finns flera vägar att gå om man vill öka graden av automatisering och självservice i sitt kontaktcenter – en av de vanligaste är att man använder sig av en chattbot eller röstbot som möter kunderna istället för en mänsklig kundservicemedarbetare.
Så lyckas du med moderna röstbotar: ”En röstbot är inte bara en talande chattbot”
kontaktcenter En modern röstbot erbjuder helt andra möjligheter än en chattbot och tekniken går snabbt framåt. Men det gäller att skräddarsy dialogen och träna upp boten fortlöpande om man vill uppnå riktigt goda resultat enligt Cecilia Drott Kisch på Voice Provider.

Någonting är fel
Läs vidare – starta din prenumeration
Medan chattbotarna är specialiserade på skriven text kan röstbotar agera i telefonikanalen och besvara inkommande samtal på samma sätt som mänskliga medarbetare. Även om de första röstbotarna hade sina begränsningar så har teknikutvecklingen gått fort under de senaste åren, och dagens röstbotar öppnar för helt nya möjligheter, samtidigt som de inte alls har särskilt mycket gemensamt med vanliga chattbotar.
– En röstbot är inte bara en chattbot som läser upp text eller ett ivr-träd med syntetiskt tal. En riktig röstbot kan förstå vad människor säger utan att behöva ha tillgång till skriptad information. Den lyssnar, tolkar och svarar i realtid precis som människor för en dialog, förklarar Cecilia Drott Kisch som är customer och partner success manager på det svenska företaget Voice Provider.
Voice Provider grundades redan år 2000 och är specialiserat på att utveckla och tillhandahålla röstbotar. Även om tekniken har funnits tillgänglig sedan många år tillbaka är det enligt Cecilia Drott Kisch inte särskilt många som har implementerat en äkta röstbot fullt ut.
– Det är många företag som lanserar voicebots eller röstbotar, men många gånger är det egentligen en chattbot som ligger till grund och som bara har fått ett talat gränssnitt, säger Cecilia Drott Kisch, som under 17 års tid har haft flera olika roller på Voice Provider.
Handlar om att förstå kundresan
Rollen som customer och partner success manager innebär kundansvar för både större företag, myndigheter och partnersamarbeten. Det handlar inte bara om försäljning och teknik, utan i hög grad om att förstå kundresan.
– Oavsett vilken roll jag har haft har fokus alltid varit på kundnytta och att skapa en användarvänlig bot, säger Cecilia Drott Kisch.
Under sin tid på Voice Provider har hon sett hur tekniken har utvecklats från enklare, nyckelordsstyrda lösningar till avancerade röstbotar som arbetar i realtid. För Techtidningen berättar hon varför det är så viktigt med dialogdesign, varför en röstbot aldrig blir helt klar och varför generativ AI inte alltid är den bästa lösningen.
En av de viktigaste fördelarna med en modern röstbot, jämfört med tidigare generationer, är att den är mycket bättre på att tolka mänskligt, fritt tal i realtid.
– Kunden kan ringa in och säga ”jag har tappat bort mitt Mastercard och vill beställa ett nytt”, och röstboten förstår detta. Det är en enorm skillnad rent tekniskt och taligenkänningen har blivit mycket bättre tack vare större språkmodeller.
Voice Provider arbetar i dagsläget med två olika teknikplattformar för sina voicebot-erbjudanden. Den ena baseras på teknik från Microsoft och den andra baseras på teknik från Google. Cecilia Drott Kisch berättar att plattformarna snabbt blir bättre och bättre med fler funktioner för röststyrning.
Men precis som den första generationen chattbotar och dess brister gav tekniken ett dåligt rykte så hade de första röstbotarna som nådde marknaden en hel del problem. Dåligt designade röstbotar i kombination med dåtidens teknik skapade en del frustration för användarna.
Även om tekniken blivit betydligt bättre på många sätt idag så räcker det inte att skaffa en röstbot och sedan förvänta sig att den ska hantera alla kunddialoger på ett framgångsrikt sätt. Tjänsten måste anpassas och med hjälp av dialogdesign kan man skapa en upplevelse som ökar kundnöjdheten.
Enligt Cecilia Drott Kisch är det inte alls samma sak att designa för tal som att designa för text.
– Tal är flyktigt. När du har sagt ett ord så försvinner det. Och du kan inte skumläsa ett samtal eller gå tillbaka i historiken som i en chatt. Därför måste en röstbot uttrycka sig kort, tydligt och med rätt tajming, säger Cecilia Drott Kisch.
En annan utmaning är att den kund som kommer i kontakt med röstboten ofta gör något annat samtidigt, som att köra bil eller laga mat.
– Det går inte att räkna med full uppmärksamhet. Därför måste botten vara extra tydlig, följa upp tystnad och ge guidning på ett intuitivt sätt. En riktig röstbot är inte en chattbot med syntetiskt tal. Den lyssnar, tolkar och svarar i realtid – som i ett samtal. Det går inte att bara klippa och klistra från text. Det måste designas för samtal, inte för menyer, förklarar Cecilia Drott Kisch.
Ett exempel på hur man bör designa sina dialoger är att placerade det viktigaste i en mening sist, snarare än först.
– Om du börjar med frågan ”vilken butik vill du besöka?”, så hinner den som ringer in börja svara innan alternativen kommit. I tal behöver man istället säga: ”Vi finns i Malmö och Göteborg – vilken butik vill du besöka?”.
För att en röstbot ska upplevas som riktigt hjälpsam måste den också förstå de ord människor faktiskt använder – inte de interna begrepp som ni säkert använder inom er organisation.
”Inte botens uppgift att rätta användaren”
– En bra bot fungerar som en tolk. Säger någon ”dagis” ska botten förstå att det handlar om förskola. Det är inte botens uppgift att rätta användaren, utan att förstå och hjälpa, säger Cecilia Drott Kisch.
Det räcker inte heller att bygga en dialog utifrån det egna tjänsteutbudet.
– Många bygger botar inifrån och ut, istället ska man göra tvärtom. Det viktiga är att bygga utifrån hur kunderna uttrycker sig och använda verkliga samtal som datakälla.
Att lansera en röstbot är också bara början. För att den ska hålla sig aktuell måste den tränas kontinuerligt.
– Språket förändras hela tiden och har man nya produkter och tjänster på sitt företag så måste boten förstå dem. De har heller inte alltid namn som finns i till exempel Googles generella språkmodell. En bot måste hållas levande, den blir aldrig klar, säger Cecilia Drott Kisch.
Hon nämner ”covid” som ett exempel på hur snabbt språket kan förändras. När de första samtalen om covid kom in till en av våra stora svenska myndigheter skickades samtalet till fallback eftersom röstboten inte kände till uttrycket.
För att upptäcka brister kan man till exempel analysera så kallade fallback-samtal, det vill säga samtal där boten inte kunna routa eller självbetjäna utifrån befintlig språkmodell och grammatik.
– Om vi ser att många ärenden hamnar i fallback och kunden säger något vi inte tolkat tidigare – då är det ett tecken på att boten behöver tränas på just det uttrycket, säger Cecilia Drott Kisch.
Träningsmomentet innebär inte bara att röstboten blir bättre på att möta kunderna, det bidrar också till att din organisation får värdefulla insikter.
– När man tränar sin röstbot får man svart på vitt vad kunderna faktiskt frågar om. Det kan ligga till grund för utbildningsinsatser, personalplanering och strategiska beslut.
Allt fler svenska företag använder röstbotar, men ofta är det i form av chattbotar med talgränssnitt. Få har implementerat en modern röstbot fullt ut.
– För vissa verksamheter fungerar det. Men för exempelvis de stora svenska myndigheterna duger det inte. Där måste varje medborgare få samma bemötande, och samtalen måste landa rätt varje gång.
Cecilia Drott Kisch berättar att Voice Provider är positiva till att få in generativ AI i röstbotar, men att det inte passar i alla situationer. Inte minst när det gäller myndigheter där det är av största vikt att kunderna får konsekventa svar och det finns inget som helst utrymme för AI-hallucinationer, där boten ”gissar” i den händelse att den inte vet vilket svar som är helt korrekt.
Medan myndigheter prioriterar konsekvent bemötande och likabehandling, ser privata aktörer större möjligheter till automatisering och generativ AI. Ett hybridvariant är att använda en traditionellt konfigurerad röstbot som bas och generativ AI, eller RAG, i de situationer där det passar.
– Företag vill ofta avlasta kundtjänst genom att styra enklare ärenden till självbetjäning. Till exempel att uppge när ett paket ska levereras, via integration med bakomliggande system.
Måste inse sina begränsningar
En annan viktig aspekt när det gäller kundnöjdhet är att botten måste inse sina egna begränsningar och vet när den ska koppla till människa.
– En smart bot vet när den inte förstår och kopplar vidare till en människa. Annars gör man våld på kundresan. Det gäller särskilt om kunden redan försökt använda någon form av självbetjäning och ringer upp igen för att få hjälp, säger Cecilia Drott Kisch.
För att inte upprepa samma flöde flera gånger måste systemet kunna känna igen återkommande samtal och anpassa svaren därefter.
Vinsterna med en bra röstbot är påtagliga, både för verksamheten och ditt kontaktcenter enligt Cecilia Drott Kisch.
– Jag jobbar med en stor norsk bank som sparar miljoner genom att bara koppla samtalen rätt på första försöket. Att svara på ett samtal två gånger är dubbelt så dyrt. Och en felkoppling är inte bara ett irritationsmoment, det påverkar också upplevd servicekvalitet.
En annan fördel med botar är att de på ett enkelt sätt ökar tillgängligheten.
– Man kan erbjuda hjälp även när kundtjänsten är stängd. Och röstgränssnittet gör att fler kan ta kontakt, inte bara de som gillar chatt eller formulär.