Haute disponibilité et réplication des données

Écrit le 17 Avril 2026 en français avec une taille de 18,2 KB

Haute disponibilité (High Availability)

Évitez d'interrompre les opérations. Les systèmes devraient posséder les éléments nécessaires pour prévenir les interruptions ou, si elles surviennent, pour minimiser leur impact et leur durée.

Éléments requis

Technologie avec un faible taux d'échec
Tolérance aux pannes en cas de catastrophe (redondance)
Procédures d'urgence établies
Commutation (manuelle ou automatique)
Suivi des modifications

Régime général de la redondance

Couches dans un système protégé

Présentation : Cette couche représente l'interface utilisateur graphique (GUI) que l'opérateur et le client voient via un navigateur internet. Elle est servie par un serveur web qui gère le contexte et la session.
La logique métier : Cette couche contient toute la logique métier. Les transactions y sont traitées, incluant les consultations de bases de données locales et externes, via des langages de script sur le serveur.
Les données : Cette couche contient la base de données physique et son système de gestion (SGBD).

La réplication des données

La réplication des données consiste au transport de données entre deux ou plusieurs serveurs. Elle permet de stocker certaines données de la base sur plusieurs sites, augmentant ainsi la disponibilité et améliorant les performances des requêtes en général.

Composants de la réplication

Éditeur : Serveur qui rend les données disponibles pour la réplication vers d'autres serveurs.
Distributeur : Serveur de base de données hébergeant la distribution, stockant les données historiques et les métadonnées des opérations.
Abonnés : Serveurs qui reçoivent les données répliquées.

Types de réplication

Instantanés : Les données du système sont répliquées telles qu'elles sont modifiées à la source.
Transactionnelle : Système de traitement des commandes et de distribution. Il peut y avoir plusieurs éditeurs pour la prise de commandes, lesquelles sont ensuite répliquées vers un entrepôt central pour l'expédition. Le magasin traite les données en lecture seule et requiert des mises à jour régulières.
Fusion (Blend) : Permet à plusieurs sites de travailler en ligne ou hors ligne de façon indépendante. Plus tard, les modifications sont fusionnées pour obtenir un résultat unique et uniforme. Les données sont synchronisées selon un calendrier ou sur demande. Par exemple, pour une base de données d'antécédents criminels, chaque municipalité peut avoir une copie régionale sans être connectée en permanence à l'organisme central.

Déterminants de la réplication

Autonomie : Mesure la capacité d'un site à fonctionner en étant déconnecté de l'éditeur de la base de données.
Cohérence transactionnelle : Déterminée par la nécessité d'exécuter toutes les transactions sur le serveur ou de simplement respecter leur ordre.
Temps de latence : Délai nécessaire pour synchroniser les copies de données. Les données doivent-elles être synchronisées à 100 % en temps réel ?

Enfin, la réplication est très utile pour améliorer la disponibilité des données. Dans un cas extrême, on parle de base de données distribuée entièrement répliquée. Cela consiste à répliquer la base complète sur chaque site du système, assurant une haute disponibilité : le système continue de fonctionner tant qu'au moins un serveur est opérationnel. L'inconvénient majeur reste le coût élevé pour maintenir la cohérence des copies sur chaque site.

Entrées associées :

Étiquettes: