Resiliens
Resiliens är förmågan hos ett system eller en verksamhet att stå emot störningar, anpassa sig till förändrade förutsättningar och fortsätta leverera viktiga funktioner även när något går fel.
Fallback innebär att ett system, en tjänst eller en verksamhet går över till ett alternativt, förenklat eller degraderat läge när den ordinarie funktionen inte längre kan upprätthållas.
Syftet är att verksamheten ska kunna fortsätta fungera på en acceptabel nivå, även om full funktionalitet inte längre är möjlig. Fallback används ofta inom IT, kommunikation, drift, beredskap och verksamhetskritiska system.
I kommunikationssystem beskriver fallback vad som händer när den ordinarie kommunikationslösningen inte fungerar som planerat.
Fallback innebär alltså inte alltid att en likvärdig lösning tar över. Ofta handlar det om att behålla de mest kritiska funktionerna, även om kapacitet, användarupplevelse eller informationsmängd försämras.
En fallback-lösning är bara användbar om den är känd, testad och accepterad av verksamheten.
Viktiga frågor är:
Fallback bör därför ses som en del av både teknisk systemdesign och organisatorisk beredskap.
Fallback-rutiner bör vara definierade i förväg. Det ska vara tydligt när fallback ska aktiveras, vem som fattar beslutet, vilka funktioner som prioriteras och hur verksamheten återgår till normalläge.
Begreppen redundans, diversitet, fallback och failover används ofta i samma sammanhang, men de beskriver olika delar av robust systemdesign.
Innebär att det finns en reserv, extra kapacitet eller en alternativ lösning som kan ta över om något slutar fungera.
Svarar på frågan: finns det något som kan ersätta huvudlösningen?
Innebär att reservlösningen skiljer sig från huvudlösningen i teknik, väg, leverantör, placering eller beroenden.
Svarar på frågan: är reserven tillräckligt oberoende för att inte drabbas av samma fel?
Innebär att ett system automatiskt växlar från huvudlösningen till en reservlösning när ett fel upptäcks.
Svarar på frågan: sker övergången automatiskt?
innebär att systemet, organisationen eller användaren går över till ett alternativt arbetssätt eller ett förenklat läge när full funktion inte längre är tillgänglig.
Svarar på frågan: vad gör vi när den ordinarie funktionen inte kan upprätthållas?
I praktiken samverkar begreppen ofta. Ett robust kommunikationssystem kan ha redundanta förbindelser, byggas med diversitet, använda failover för automatisk växling och samtidigt ha definierade fallback-rutiner för situationer där full funktion inte kan upprätthållas.
En lösning kan vara redundant utan att ha god diversitet. Två fiberförbindelser i samma kanalisation ger exempelvis en reserv, men båda kan slås ut av samma grävarbete. På samma sätt kan det finnas redundans utan failover, om användaren själv måste växla till reservsystemet. Fallback blir aktuellt när reservlösningen inte ger samma funktion som huvudsystemet, men ändå gör det möjligt att fortsätta verksamheten på en acceptabel nivå.
Redundans innebär att det finns extra resurser, reservvägar eller alternativa system som kan ta över om något slutar fungera.
Diversitet innebär att redundanta lösningar skiljer sig åt i teknik, väg, leverantör, placering eller beroenden. Syftet är att minska risken att samma fel slår ut både huvudlösningen och reservlösningen.
Failover innebär att ett system automatiskt växlar från en primär resurs till en reservresurs när ett fel upptäcks.
Single Point of Failure, ofta förkortat SPOF, är en komponent, funktion, förbindelse eller beroendepunkt som ensam kan orsaka att ett helt system eller en kritisk funktion slutar fungera.