PostgreSQLLa base de données la plus sophistiquée au monde.
Documentation PostgreSQL 17.1 » Internes » Protocole Frontend/Backend » Protocole de réplication logique en flux

53.5. Protocole de réplication logique en flux #

Cette section décrit le protocole de réplication logique qui consiste en un flux de message démarré par la commande START_REPLICATION SLOT nom_slot LOGICAL.

Le protocole de réplication logique en flux se base sur les primitives du protocole de réplication physique en flux.

Le décodage logique PostgreSQL accepte des plugins de sortie. pgoutput est le plugin standard utilisé par la réplication logique native.

53.5.1. Paramètres de la réplication logique en flux #

En utilisant la commande de réplication logique START_REPLICATION, le plugin pgoutput accepte les options suivantes :

proto_version

La version du protocole. Actuellement, les versions 1, 2, 3 et 4 sont supportées. Une version valide est requise.

La version 2 n'est supportée qu'à partir de la version 14 et permet la transmission de transactions volumineuses non terminées.

La version 3 n'est supportée qu'à partir de la version 15 et permet l'utilisation de la validation en deux phases (2PC) avec la réplication logique.

La version 4 est acceptée uniquement à partir de la version 16, et elle permet l'envoi de grandes transactions en cours pour une application en parallèle.

publication_names

Liste séparée par des virgules contenant les noms de publication auxquelles s'abonner (recevoir les modifications). Les noms individuels de publication sont traités comme des noms d'objets standard et peuvent être mis entre guillemets si nécessaire. Il est requis d'indiquer au moins un nom de publication.

binary

Option booléenne pour utiliser le mode de transfert binaire. Le mode binaire est plus rapide que le mode texte mais un peu moins robuste.

messages

Option booléenne pour activer l'envoi de messages qui sont écrits par pg_logical_emit_message.

streaming

Option booléenne pour activer l'envoi en flux des transactions en cours. Il accepte une valeur supplémentaire parallel pour activer l'envoi d'informations supplémentaires avec certains messages utilisés pour la parallélisation. Il est requis d'activer au minimum la version 2 du protocole. La version 4 est nécessaire pour l'option parallel.

two_phase

Option booléenne pour activer les transactions en deux phases. Il est requis d'activer au minimum la version3 du protocole.

origin

Option pour envoyer les changements suivant leur origine. Les valeurs possibles sont none pour envoyer uniquement les changements qui n'ont pas d'origine associée, et any pour envoyer les changements quelque soit leur origine. Ceci peut être utilisé pour éviter des boucles (réplication infinie de la même donnée) parmi les nœuds de réplication.

53.5.2. Messages du protocole de réplication logique #

Les messages individuels du protocole sont discutés dans les sous-sections suivantes. Les messages individuels sont décrits dans Section 53.9.

Tous les message haut niveau du protocole commencent avec un octet de type de message. Bien que représenté dans le code comme un caractère, c'est en fait un octet signé sans encodage associé.

Comme le protocole de réplication en flux fournit une longueur de message, il n'est pas nécessaire que les messages haut niveau du protocole embarquent une longueur dans leur en-tête.

53.5.3. Flot des messages du protocole de réplication logique #

À l'exception de la commande START_REPLICATION et des messages de progression du rejeu, toutes les informations se déplacent uniquement du backend vers le client.

Le protocole de réplication logique envoie les transactions individuelles l'une après l'autre. Cela signifie que tous les messages entre une paire de messages Begin et Commit appartiennent à la même transaction. De façon similaire, tous les messages entre une paire de messages Begin Prepare et Prepare appartiennent à la même transaction. Il envoie aussi les changements de grosses transactions en cours entre une paire de messages Stream Start et Stream Stop. Le dernier lot d'une telle transaction contient un message Stream Commit ou Stream Abort.

Chaque transaction envoyée contient zéro ou plusieurs messages DML (Insert, Update, Delete). Dans le cas d'une configuration en cascade, elle peut aussi contenir des messages Origin. Le message origine indique que la transaction provient d'un autre nœud de réplication. Comme un nœud de réplication peut être à peu près tout dans le cas du protocole de réplication logique, le seul identifiant est le nom de l'origine. C'est au client de gérer ceci. Le message Origin est toujours envoyé avant tout message DML dans la transaction.

Chaque message DML contient un OID de relation, identifiant la relation concernée. Avant le premier message DML pour un OID de relation donné, un message Relation sera envoyé, décrivant le schéma de cette relation. Après cela, un nouveau message Relation sera envoyé si la définition de la relation a changé depuis l'envoi du dernier message Relation. (Le protocole suppose que le client est capable de se rappeler de cette méta donnée pour toutes les relations impliquées.)

Les messages Relation identifient les types des colonnes par leur OID. Dans le cas d'un type interne, il est supposé que le client peut rechercher cet OID localement, donc aucune donnée supplémentaire n'est nécessaire. Pour les OID de type utilisateur, un message Type sera envoyé avant le message Relation pour fournir le nom du type associé à cet OID. De ce fait, un client qui a besoin d'identifier spécifiquement les types des colonnes d'une relation devrait placer en cache le contenu des messages Type, et consulter ce cache pour vérifier si l'OID du type y est défini. Dans le cas contraire, il sera possible de rechercher localement l'OID du type.