Minut för minut
Rapporten till PTS beskriver händelseförloppet i från det att störningen i en signaleringsnod upptäcks vid 15:52 till det att trafiken fungerar normalt 20:44. Bland annat kan man se att det tog 21 minuter från första larmet till att Telia hade information om störningen uppe på sin hemsida. 48 minuter efter larmet tas en del utlandstrafiklänkar ur drift för att minska belastningen på de redundanta noderna som inte klarar att hantera all trafik. Efter 1 timme och 28 minuter har man teknisk personal på väg till den krånglande noden i Göteborg eftersom den behöver hanteras lokalt.
18:18, knappt två och en halv timme efter larmet, tar man beslutet att släcka ned 2g-nätet söder om Göteborg enligt nödrutin. Kort därefter kan den felaktiga noden startas om och 18:48 tas 2g-nätet i drift igen. Då är den värsta krisen avhjälpt och 20:44, efter ytterligare uppstartsprocedurer, är hela störningen avhjälpt.
Konstruktionsfel i signaleringsnod
Störningarna orsakades ett konstruktionsfel i signaleringsnodens mjukvara i kombination med hög belastning, delvis till följd av en omstart av en 3g-trafiknod. Konstruktionsfelet, som Telia inte hade information om, låg i signaleringsnodens centralprocessor och var enligt Telias och leverantörens undersökning den utlösande faktorn till fredagens störningar. De redundanta noderna som fick ta över all signalering klarade inte av sin uppgift utan endast 30 procent av normal trafik hanterades när störningen var som värst.
Uppgraderar snabbt
Telia har genomfört, och kommer även att genomföra, en rad åtgärder för att förhindra nya störningar. Arbetet med att uppgradera signaleringsnodernas centralprocessorer påbörjades redan måndagen den 19 maj. En mjukvaru-uppdatering för att korrigera konstruktionsfelet sker under de närmaste veckorna. I avvaktan på detta genomför Telia ytterligare åtgärder för att förhindra nya störningar. Bland annat utökning av kapacitet, fortsatt förstärkt övervakning samt bibehållen förhöjd beredskap till dess att alla pågående och planerade åtgärder är genomförda.
Målsättningen är, enligt rapporten till PTS, att inga störningar i enskilda noder ska kunna slå ut trafiken när uppgraderingsarbetet är klart.
Denna artikel var tidigare publicerad på tidningen telekomidag.se