Documentation PostgreSQL 8.1.23 > Référence > Applications client de PostgreSQL > pg_dump | |
pg_config | pg_dumpall |
pg_dump — sauvegarder une base de données PostgreSQL™ dans un script ou tout autre fichier d'archive
pg_dump [option...] [nom_base]
pg_dump est un outil de sauvegarde d'une base de données PostgreSQL™. Les sauvegardes réalisées sont cohérentes, même lors d'accès concurrents à la base de données. pg_dump ne bloque pas l'accès des autres utilisateurs (ni en lecture ni en écriture).
Les extractions peuvent être réalisées sous la forme de scripts ou de fichiers d'archive. Les scripts sont au format texte et contiennent les commandes SQL nécessaires à la reconstruction de la base de données dans l'état où elle était au moment de la sauvegarde. La restauration s'effectue en chargeant ces scrits avec psql(1). Ces scripts permettent de reconstruire la base de données sur d'autres machines et d'autres architectures, et même, au prix de quelques modifications, sur d'autres bases de données SQL.
La reconstruction de la base de données à partir d'autres formats de fichiers archive est obtenue avec pg_restore(1). pg_restore permet, à partir de ces formats, de sélectionner les éléments à restaurer, voire de les réordonner avant restauration. Les fichiers d'archive sont conçus pour être portables au travers d'architectures différentes.
Lorsqu'il est utilisé avec un des formats de fichier d'archivé en combinaison avec pg_restore, pg_dump fournit un mécanisme d'archivage et de transfert flexible. pg_dump peut être utilisé pour sauvegarder une base de données dans son intégralité ; pg_restore peut alors être utilisé pour examiner l'archive et/ou sélectionner les parties de la base de données à restaurer. Le format de fichier de sortie le plus flexible est le format « personnalisé » (custom en anglais, -Fc). Compressé par défaut, il permet de sélectionner et réordonner les éléments archivés. Non compressé, le format tar (-Ft) ne permet pas de réordonner les données au chargement mais est somme toute assez flexible. Qui plus est, il est utilisable par des outils Unix standard comme tar.
Lors de l'exécution de pg_dump, il est utile de surveiller les messages d'avertissement (affichés sur la sortie erreur standard), en particulier en ce qui concerne les limitations indiquées ci-dessous.
Les options suivantes de la ligne de commande contrôlent le contenu et le format de la sortie.
Le nom de la base de données à sauvegarder. En l'absence de précision, la variable d'environnement PGDATABASE est utilisée. Si cette variable n'est pas positionnée, le nom de l'utilisateur de la connexion est utilisé.
Seules les données sont sauvegardées, pas le schéma (définition des données).
Cette option n'a d'intérêt que pour le format texte. Pour les formats archive, l'option est spécifiée à l'appel de pg_restore.
Les commandes de nettoyage (suppression) des objets de la base sont écrites avant les commandes de création.
Cette option n'a d'intérêt que pour le format texte. Pour les formats archive, l'option est spécifiée à l'appel de pg_restore.
La sortie débute par une commande de création de la base de données et de connexion à cette base. Peu importe dans ce cas la base de données à laquelle la connexion est faite avant la restauration.
Cette option n'a d'intérêt que pour le format texte. Pour les formats archive, l'option est spécifiée à l'appel de pg_restore.
Les données sont copiées à l'aide de commandes INSERT plutôt que COPY. La restauration en est considérablement ralentie. Cela s'avère essentiellement utile pour créer des sauvegardes rechargées dans des bases de données autres que PostgreSQL™. La restauration échoue tout de même si les colonnes ont été réorganisées. L'option -D est plus sûre, mais encore plus lente. De plus, même si cette option engendre une erreur à chaque donnée invalide, les autres commandes INSERT continuent le chargement des données dans la table.
Les données sont copiées à l'aide de commandes INSERT qui explicitent les noms de colonnes (INSERT INTO table (colonne, ...) VALUES ...). La restauration en est considérablement ralentie. Cela s'avère essentiellement utile pour créer des sauvegardes rechargées dans des bases de données autres que PostgreSQL™. De plus, même si cette option engendre une erreur à chaque donnée invalide, les autres commandes INSERT continuent le chargement des données dans la table.
La sortie est redirigée vers le fichier spécifié. Sans précision, la sortie standard est utilisée.
La sauvegarde est créée dans l'encodage spécifié. Par défaut, la sauvegarde utilise celui de la base de données. Le même résultat peut être obtenu en positionnant la variable d'environnement PGCLIENTENCODING avec le codage désiré pour la sauvegarde.
Le format de la sortie. format correspond à un des éléments suivants :
Fichier de scripts SQL en texte simple (défaut).
Archive tar utilisable par pg_restore. Ce format permet d'ordonner et/ou d'exclure des objets lors de la restauration de la base. Il est également possible de restreindre les données rechargées lors de la restauration.
Archive personnalisée utilisable par pg_restore. C'est le format le plus flexible puisqu'il permet d'ordonner le chargement des données et la définition des objets. Ce format est compressé par défaut.
Les différences de version entre pg_dump et le serveur de bases de données sont ignorées.
pg_dump peut gérer des bases de données de versions différentes, mais les très anciennes versions ne sont plus supportées (actuellement celles antérieures à la 7.0). Cette option est utilisée lorsque la vérification de version ne doit pas être effectuée. Dans ce cas, il se peut que pg_dump échoue.
Seul le contenu de schéma est sauvegardé. Si cette option n'est pas précisée, tous les schémas de la base de données considérée, autres que ceux systèmes, sont sauvegardés.
Dans ce mode, pg_dump ne sauvegarde aucun objet de quelque autre base de données dont peuvent dépendre les objets du schéma sélectionné. De ce fait, aucune garantie n'est donnée quant au succès d'une restauration dans une base vierge des données issues de la sauvegarde du seul schéma.
Les identifiants d'objets (OID) sont sauvegardés comme donnée des tables. Cette option est utilisée dans le cas d'applications utilisant des références aux colonnes OID (dans une contrainte de clé étrangère, par exemple). Elle ne devrait pas être utilisée dans les autres cas.
Les commandes d'initialisation des possessions des objets au regard de la base de données originale ne sont pas produites. Par défaut, pg_dump engendre des instructions ALTER OWNER ou SET SESSION AUTHORIZATION pour fixer ces possessions. Ces instructions échouent lorsque le script n'est pas lancé par un superutilisateur (ou par l'utilisateur qui possède tous les objets de ce script). L'option -O est utilisée pour créer un script qui puisse être restauré par n'importe quel utilisateur. En revanche, c'est cet utilisateur qui devient propriétaire de tous les objets.
Cette option n'a d'intérêt que pour le format texte. Pour les formats archive, l'option est spécifiée à l'appel de pg_restore.
Cette option, obsolète, est toujours acceptée pour des raisons de compatibilité ascendante.
Seule la définition des objets (le schéma) est sauvegardée, pas les données.
Le nom du superutilisateur à utiliser lors de la désactivation des déclencheurs. Cela n'a d'intérêt que si l'option --disable-triggers est précisée. (En règle générale, il est préférable de ne pas utiliser cette option et de lancer le script engendré en tant que superutilisateur.)
Seules les données table sont sauvegardées. Il se peut que plusieurs tables aient le même nom dans des schémas différents. Dans ce cas, toutes les tables correspondantes sont sauvegardées. Pour ne sélectionner qu'une seule table, à la fois --schema et --table sont précisés.
Dans ce mode, pg_dump ne sauvegarde aucun objet d'autres bases de données dont la table sélectionnée peut dépendre. De ca fait, aucune garantie n'est données sur le succès de la restauration dans une base vierge de la sauvegarde des données de cette seule table.
Mode verbeux. pg_dump affiche des commentaires détaillés sur les objets et les heures de début et de fin dans le fichier de sauvegarde. Des messages de progression sont également affichés sur la sortie erreur standard.
Les droits d'accès (commandes grant/revoke) ne sont pas sauvegardés.
Cette option désactive l'utilisation des guillemets dollar pour le corps des fonctions. La syntaxe SQL standard des chaînes est utilisée pour la mise entre guillemets du corps des fonctions.
Cette option n'a d'intérêt que dans le cas de sauvegarde des données seules. Dans ce cas, pg_dump inclut à la sortie des commandes permettant de désactiver temporairement les déclencheurs sur les tables cibles lors du chargement des données. Cette commande est utilisée lorsqu'il existe sur les tables des vérifications d'intégrité référentielles ou des déclencheurs dont l'exécution n'est pas souhaitable lors du chargement des données.
À l'heure actuelle, les commandes engendrées par --disable-triggers doivent être exécutées par le superutilisateur. Il est donc nécessaire que le nom du superutilisateur soit également précisé, à l'aide de -S. Le script résultant peut aussi être lancé par le superutilisateur (c'est d'ailleurs préférable).
Cette option n'a d'intérêt que pour le format texte. Pour les formats archive, l'option est spécifiée à l'appel de pg_restore.
Les commandes SET SESSION AUTHORIZATION du standard SQL sont affichées à la place des commandes ALTER OWNER pour préciser le propriétaire d'un objet. Cela rend la sauvegarde plus compatible avec le standard mais, en fonction de l'historique des objets dans la sauvegarde, il se peut que la restauration soit incorrecte. De plus, une sauvegarde qui utilise SET SESSION AUTHORIZATION nécessite pour la restauration des droits superutilisateur tandis que ALTER OWNER requiert des privilèges moins étendus.
Spécifie le niveau de compression à utiliser. Zéro signifie sans compression. Pour le format d'archive personnalisé, cela signifie la compression des segments individuels des données des tables. La valeur par défaut est de compresser à un niveau modéré. Pour le format texte, indiquer une valeur différente de zéro fait que le fichier entier est compressé, bien qu'il a été envoyé à gzip ; mais par défaut, la sortie n'est pas compressée. Le format d'archive tar ne supporte pas du tout la compression.
Les options de ligne de commande suivantes gèrent les paramètres de connexion :
Le nom d'hôte de la machine sur laquelle le serveur de bases de données est exécuté. Si la valeur commence par une barre oblique (/), elle est utilisée comme répertoire pour le socket de domaine Unix. La valeur par défaut est fournie par la variable d'environnement PGHOST, si elle est initialisée. Dans le cas contraire, une connexion sur la socket de domaine Unix est tentée.
Le port TCP ou le fichier local de socket de domaine Unix sur lequel le serveur écoute les connexions. La valeur par défaut est fournie par la variable d'environnement PGPORT, si elle est initialisée. Dans le cas contraire, il s'agit de la valeur fournie à la compilation.
Le nom d'utilisateur utilisé pour la connexion.
Un mot de passe est demandé dans tous les cas. Ce comportement est celui automatiquement obtenu lorsque le serveur requiert une authentification par mot de passe.
pg_dump exécute intrinsèquement des instructions SELECT. Si des problèmes apparaissent à l'exécution de pg_dump, psql(1) peut être utilisé pour s'assurer de la possibilité de sélectionner des informations dans la base de données.
Si des ajouts locaux à la base template1 ont été effectués dans le groupe de bases de données, il est impératif de s'assurer que la sortie de pg_dump est effectivement restaurée dans une base vide ; dans le cas contraire, il est fort probable que la duplication des définitions des objets ajoutés engendre des erreurs. Pour obtenir une base vide de tout ajout local, on utilise template0 à la place de template1 comme modèle. Par exemple :
CREATE DATABASE foo WITH TEMPLATE template0;
pg_dump souffre quelques limitations :
Lorsqu'une sauvegarde des seules données est sélectionnée et que l'option --disable-triggers est utilisée, pg_dump engendre des commandes de désactivation des déclencheurs sur les tables utilisateur avant l'insertion des données et des commandes de réactivation après l'insertion. Si la restauration est interrompue, il se peut que les catalogues systèmes conservent cette position.
Les fichiers d'une archive tar sont limités à une taille inférieure à 8 Go. (C'est une limitation inhérente au format des fichiers tar.) Ce format ne peut donc pas être utilisé si la représentation textuelle d'une table dépasse cette taille. La taille totale d'une archive tar et de tout autre format de sortie n'est pas limitée, sauf peut-être par le système d'exploitation.
Le fichier de sauvegarde engendré par pg_dump ne contient pas les statistiques utilisées par l'optimiseur pour la planification des requêtes. Il est donc conseillé, pour assurer des performances correctes, de lancer ANALYZE après la restauration d'une sauvegarde.
pg_dump est utilisé pour transférer des données vers les nouvelles versions de PostgreSQL™. De ce fait, le résultat de pg_dump peut être chargé dans des bases de données PostgreSQL™ de versions supérieures. Ce résultat peut aussi être lu par des serveurs PostgreSQL™ plus anciens. Néanmoins, pg_dump ne peut généralement pas lire des bases de données plus récentes ou produire une sauvegarde qui puisse être chargée par des versions antérieures. Pour cela, une édition manuelle de la sauvegarde peut se révéler nécessaire.
Sauvegarder une base de données :
$ pg_dump mabase > base.out
Recharger cette base de données :
$ psql -d base -f base.out
Sauvegarder une base de données nommée mabase dans un fichier tar :
$ pg_dump -Ft mabase > base.tar
Charger cette sauvegarde dans une base de données existante appelée nouvellebase :
$ pg_restore -d nouvellebase base.tar
L'outil pg_dump est apparu à l'oigine dans Postgres95 version 0.02. Les formats de sortie non textuels ont été introduits dans la version 7.1 de PostgreSQL™.