Reflecties op de onderbreking van de services

Soms komt het voor dat de diensten van Nubo tijdelijk niet beschikbaar zijn. Dit kan veroorzaakt worden door een technisch probleem zijn op de servers van de coöperatie (dat we natuurlijk zo snel mogelijk proberen op te lossen), maar soms is het een algemener probleem in het datacenter waar de servers van Nubo worden gehost.

Op donderdag 28 september 2023 waren de diensten van Nubo bijvoorbeeld ongeveer twee uur lang onbereikbaar. Dit kwam door een defect in het datacenter waar onze servers gehost worden, een probleem dat buiten onze controle viel (er was defecte hardware in het datacenter, stroomopwaarts vanaf het punt waar Nubo verantwoordelijk is). Dit type onderbreking komt heel weinig voor, hoogstens in de orde van enkele uren per jaar (d.w.z. enkele honderdsten van een procent van de jaarlijkse tijd).

Alhoewel zoiets een heel zeldzame gebeurtenis is, is het wel erg vervelend omdat er op dat moment niets toegankelijk is: de site niet, de services niet, en ook e-mail of synchronisatie met de cloud niet. Sommige online diensten hebben heel weinig of geen downtime, dus waarom Nubo dan wel?

100% beschikbaarheid garanderen vereist volledige redundantie voor álle diensten. Het datacenter waar Nubo gehost wordt, biedt al meerdere redundanties: meerdere lijnen zijn verbonden het met het internet en er zijn ook meerdere elektriciteitsvoorzieningen voorzien. Nubo heeft zelf ook voor redundantie gezorgd: de diensten draaien op een groep van drie servers die de belasting verdelen en de gegevens distribueren; als ėėn van hen defect raakt of niet meer werkt, kunnen de andere twee gebruikt worden om het over te nemen, zodat het technische team de tijd heeft om de server te repareren of te vervangen. Indien nodig kun je zelfs een vierde server aan de groep toevoegen, bijvoorbeeld als de groei van de diensten dat vereist.

Volledige redundantie zou betekenen dat er áltijd een werkende kopie van álle diensten van Nubo zou moeten worden gehost in een tweede datacenter, dat ook uitgerust is met een eigen netwerktoegang, stroomvoorziening, enz. Deze kopie zou functioneel moeten zijn, dat wil zeggen ’live’, en verbonden moeten met het netwerk van Nubo. Deze kopie kan niet gewoon een back-up zijn, omdat je er onmiddellijk naar terug moet kunnen schakelen in geval van een storing in het eerste datacenter. Dit brengt extra kosten met zich mee (aankoop van servers, huur van ruimte in een tweede datacenter, voldoende bandbreedte om de servers van Nubo continu te synchroniseren tussen de twee datacenters, enz.), maar ook extra werktijd (configuratie, beheer, onderhoud, enz.). De kosten zijn natuurlijk ook ecologisch: we zouden meer hardware verbruiken, maar ook meer middelen, omdat de ‘redundante’ servers voortdurend ingeschakeld moeten blijven terwijl ze slechts enkele uren per jaar reëel gebruikt worden, oftewel gemiddeld 99,97% van de tijd nutteloos zijn.

Mėėr volledige redundantie zou ook de beschikbaarheid van diensten garanderen bij ernstigere incidenten in het datacenter (brand, overstroming, uitzonderlijke keten van incidenten, enz.), waardoor de toegang tot de servers van Nubo misschien over een langere periode zou kunnen worden afgesneden. De gegevens zouden in zo’n geval niet verloren gaan omdat Nubo back-ups maakt op een secundaire locatie, op een kleinere server, achter een langzamere verbinding. Er wordt gewoon een kopie van de gegevens gemaakt, zonder de hele architectuur te dupliceren die nodig is voor interfaces, software, permanente verbindingen voor alle gebruikers, enzovoort. Maar de tijd die nodig is om het datacenter te herstellen of om back-ups terug te zetten, kan in zulke gevallen veel langer zijn.

Inzetten op gedeeltelijke redundantie, met behoud van gegevensintegriteit, is dus niet enkel een financiële, maar ook een ethische keuze, die moet worden afgewogen tegen het ongemak voor gebruikers wanneer de diensten heel af en toe tijdelijk worden onderbroken.