Beschikbaarheid en betrouwbaarheid, help!

Vaak hoor ik de vragen als “Wat houden deze begrippen in?”, “Hoe gaan we hiermee om?” en “Is een analyse echt nodig, we gaan toch grondig testen?” Dit is jammer, want hoge beschikbaarheid en betrouwbaarheid kan alleen behaald worden als de basiskennis van de bijbehorende technieken, waaronder een analyse, bekend zijn binnen het projectteam en iedereen hieraan bijdraagt. Vandaar een korte introductie over de beschikbaarheids- en betrouwbaarheidsanalyses, oftewel de RAMS analyses.  

Afhankelijkheid van systemen
De samenleving wordt in toenemende mate afhankelijk van systemen die steeds complexer worden. Automatisering is doorgedrongen in allerlei toepassingen. We vertrouwen steeds meer op de beschikbaarheid en de correcte werking van deze toepassingen, wat ons afhankelijk en dus kwetsbaar maakt.

Systemen zijn veiligheidskritisch als deze een gevaar vormen voor mensenlevens, zware verwondingen of grote milieuschade kunnen veroorzaken. Hierbij geldt het principe dat veiligheidsrisico’s zo laag als redelijkerwijs haalbaar (ALARP: As Low As Reasonably Practicable) dienen te zijn.

Bedrijfs- of missiekritische systemen kunnen, bij falen, leiden tot economische schade, maatschappelijk onverantwoorde gevolgen of imagoschade.
Voor zowel Veiliheidskritische- als voor Bedrijfskritische systemen zijn er daarom stringente vereisten aan de beschikbaarheid en betrouwbaarheid van toepassing. Om deze eisen invulling te geven moet er tijdens het ontwerp al rekening mee worden gehouden. Als tijdens een test blijkt dat niet aan deze eisen is voldaan zijn we al te laat, omdat we dan in veel gevallen terug moeten naar de tekentafel om het ontwerp aan te passen. De kosten die met een dergelijke ontwerpaanpassing gemoeid zijn significant en moeten dus zo veel als mogelijk voorkomen worden. Door deze eisen actief te borgen tijdens de ontwerpfase kunnen we een ‘first time right’ bereiken.

Risicobepaling door what-if analyse
Een van de technieken voor de risicobepaling van een systeem is om een gestructureerde what-if analyse uit te voeren op het systeem. Systematisch wordt bepaald wat het effect van falen van één van de functies of één van de onderdelen van het systeem is op de werking van het totale systeem. Hierna kan worden bepaald of, en in hoeverre, het effect een veiligheids- of bedrijfsrisico is. Als deze risico’s eenmaal zijn bepaald dan kunnen hiervoor mitigerende maatregelen worden vastgesteld die de kans op falen verminderen of het effect minder ernstig maken.
Doormiddel van FMEA/FMECA, HAZOP en/of (preliminary) hazard analysis kunnen deze what‑if analyses worden uitgevoerd. Het organiseren van workshops met kennisdragers is hierbij een vaak toegepaste methode.

In de praktijk:
Voor de vervanging van een middleware berichtendienst in een industriële omgeving hebben we een workshop gehouden. Voor elke uitgaand bericht werd de vraag gesteld, wat gebeurd er als het bericht niet, verkeerd of te laat aankomt. Voor elk van de situaties is het risico bepaald, en gekeken of het gedetecteerd kon worden en opgevangen kon worden door alternatieve systemen of procedures, zonder de productie wezenlijk te verstoren. Dit bleek altijd te kunnen. Wel zijn procedures aangepast. Verder zijn testen van de gekoppelde systemen aangepast zodat geborgd blijft dat het vastgestelde effect in de analyse blijft bestaan bij aanpassingen van deze systemen.

Verdere analyse
De what-if analyse werkt goed voor minder complexe systemen met relatief weinig risico.  In andere gevallen zijn aanvullende technieken nodig, zoals foutenbomen en een integrale aanpak.


Lees deel 2 van mijn blog over beschikbaarheid, betrouwbaarheid, foutenbomen en andere technieken >>

Deel dit blogitem

Over Ronald Bugter

RAMS manager bij Soltegro

Ronald werkt als RAMS manager bij Soltegro en maakt beschikbaarheids- en betrouwbaarheidsanalyses. In zijn vrije tijd speelt Ronald een potje volleybal of vaart hij in een kano.