Resiliens
Resiliens är förmågan hos ett system eller en verksamhet att stå emot störningar, anpassa sig till förändrade förutsättningar och fortsätta leverera viktiga funktioner även när något går fel.
Failover innebär att ett system automatiskt växlar från en primär resurs till en reservresurs när ett fel upptäcks.
Syftet är att minska avbrottstiden och upprätthålla funktion även när en komponent, förbindelse eller tjänst slutar fungera.
I kommunikationssystem används failover för att säkerställa att trafik kan fortsätta flöda även om en del av infrastrukturen fallerar.
Det kan exempelvis handla om:
Failover är särskilt viktigt i verksamheter där även korta avbrott kan påverka säkerhet, drift, ledning eller samverkan.
Målet med failover är ofta att användaren inte ska märka avbrottet, eller åtminstone att påverkan ska bli så liten som möjligt. Men i praktiken beror resultatet på hur systemet är utformat.
Vid vissa typer av failover kan pågående sessioner fortsätta utan avbrott. I andra fall kan användaren märka en kort fördröjning, behöva återansluta eller tappa vissa funktioner tillfälligt. Den nya förbindelsen kanske inte heller har samma kapacitet och vissa tjänster behöver därför prioriteras och andra begränsas.
När failover utformas bör man inte bara fråga om systemet kan växla till en reserv, utan också hur växlingen sker och vad som händer efteråt.
En failover-lösning är bara tillförlitlig om den är dokumenterad, övervakad, testad och anpassad till verksamhetens faktiska krav.
Begreppen redundans, diversitet, fallback och failover används ofta i samma sammanhang, men de beskriver olika delar av robust systemdesign.
Innebär att det finns en reserv, extra kapacitet eller en alternativ lösning som kan ta över om något slutar fungera.
Svarar på frågan: finns det något som kan ersätta huvudlösningen?
Innebär att reservlösningen skiljer sig från huvudlösningen i teknik, väg, leverantör, placering eller beroenden.
Svarar på frågan: är reserven tillräckligt oberoende för att inte drabbas av samma fel?
Innebär att ett system automatiskt växlar från huvudlösningen till en reservlösning när ett fel upptäcks.
Svarar på frågan: sker övergången automatiskt?
innebär att systemet, organisationen eller användaren går över till ett alternativt arbetssätt eller ett förenklat läge när full funktion inte längre är tillgänglig.
Svarar på frågan: vad gör vi när den ordinarie funktionen inte kan upprätthållas?
I praktiken samverkar begreppen ofta. Ett robust kommunikationssystem kan ha redundanta förbindelser, byggas med diversitet, använda failover för automatisk växling och samtidigt ha definierade fallback-rutiner för situationer där full funktion inte kan upprätthållas.
En lösning kan vara redundant utan att ha god diversitet. Två fiberförbindelser i samma kanalisation ger exempelvis en reserv, men båda kan slås ut av samma grävarbete. På samma sätt kan det finnas redundans utan failover, om användaren själv måste växla till reservsystemet. Fallback blir aktuellt när reservlösningen inte ger samma funktion som huvudsystemet, men ändå gör det möjligt att fortsätta verksamheten på en acceptabel nivå.
Redundans innebär att det finns extra resurser, reservvägar eller alternativa system som kan ta över om något slutar fungera.
Diversitet innebär att redundanta lösningar skiljer sig åt i teknik, väg, leverantör, placering eller beroenden. Syftet är att minska risken att samma fel slår ut både huvudlösningen och reservlösningen.
Fallback innebär att ett system, en tjänst eller en verksamhet går över till ett alternativt, förenklat eller degraderat läge när den ordinarie funktionen inte längre kan upprätthållas.
Single Point of Failure, ofta förkortat SPOF, är en komponent, funktion, förbindelse eller beroendepunkt som ensam kan orsaka att ett helt system eller en kritisk funktion slutar fungera.