Whisper är en välkänd AI-modell som OpenAI tagit fram för att transkribera tal till text på ett flertal olika språk. Svenska är ett av de över 50 språk som ingår i Whisper, men eftersom modellen täcker så många språk så har den också sina brister.
Kungliga bibliotekets AI-modell utklassar OpenAI
AI AI-modellen KB-Whisper har tränats upp på svenska språket och ska vara avsevärt bättre än OpenAI:s grundmodell på att transkribera tal till text.

Någonting är fel
Läs vidare – starta din prenumeration
Kungliga biblioteket såg en möjlighet att skapa en bättre AI-modell och har nu tränat upp KB-Whisper med över 50 000 timmar talad svenska från bland annat tv-sändningar och riksdagsdebatter.
Resultatet uppges vara att KB-Whisper är avsevärt bättre på att transkribera svenska än vad grundmodellen från OpenAI är. Kungliga bibliotekets egna tester visar att antalet fel på ordnivå har minskat med 47 procent.
– Det här är en milstolpe för taligenkänning på svenska. Modellen har tränats på en mycket stor mängd svensk data och har därför en väldigt god kännedom om språket. KB-Whisper är särskilt bra på att stava rätt på svåra svenska ort- och personnamn och komplicerade termer, säger Leonora Vesterbacka, senior data scientist på KB.
Den nya AI-modellen kan komma till användning på många olika områden, exempelvis för att skapa automatiska undertexter till tv-produktion eller för att underlätta vid sökningar i Kungliga bibliotekets samlingar. Men även i kontaktcentervärlden, där man ofta kan ha nytta av att transkribera tal, väntas KB-Whisper komma till användning för att höja kvaliteten på olika tjänster.
AI-modellen finns tillgänglig för nedladdning utan kostnad på plattformen Huggingface. Härifrån kan man också få tillgång till de övriga AI-modeller som Kungliga biblioteket har tagit fram.
