Impact van latency op database-replicatie
Databases slaan waardevolle gegevens op, zoals het saldo van een bankrekening, bestellingen in een webshop of andere bedrijfskritische klantdata. Het is essentieel dat databases die deze gegevens beheren, optimaal presteren, lage responstijden hebben, de meest actuele data beschikbaar stellen en consistent blijven. Een veelgebruikte best practice om deze eigenschappen te realiseren, is het repliceren van data over meerdere nodes en het ontsluiten ervan vanuit geografisch gescheiden locaties.
Database-replicatie in gedistribueerde systemen
Database-replicatie is een mechanisme binnen gedistribueerde systemen dat bijdraagt aan fault-tolerance en hoge beschikbaarheid. Naarmate organisaties wereldwijd opereren, worden multi-availability zones ingezet om infrastructuur in verschillende regio’s te deployen via cloudplatforms. Database-replicatie helpt om data consistent te houden tussen deze verschillende availability zones.
Netwerklatency in het replicatieproces
Doordat data wordt gerepliceerd over regio’s die geografisch ver uit elkaar liggen, introduceert de afstand tussen deze zones onvermijdelijk netwerklatency in het replicatieproces. Latency vormt in high-speed netwerken de meest dominante component van de totale round-trip time (RTT). Afhankelijk van het gekozen consistentie model en de replicatie-opzet kan latency invloed hebben op databaseperformance, databeschikbaarheid en dataconsistentie. Latency introduceert daarmee extra complexiteit in de vorm van afwegingen tussen verschillende replicatie- en consistentie modellen binnen een implementatie.
Onderzoeksdoel
Dit onderzoek had als doel inzicht te verkrijgen in de impact van netwerklatency op transactionele database-replicatie binnen gesimuleerde, geografisch gescheiden database-omgevingen.