Write-Ahead Logging (WAL) est une méthode conventionnelle pour s'assurer de l'intégrité des données. Une description détaillée peut être trouvée dans la plupart des livres sur le traitement transactionnel. Brièvement, le concept central du WAL est d'effectuer les changements des fichiers de données (donc les tables et les index) uniquement après que ces changements ont été écrits de façon sûr dans un journal, appelé journal des transactions. Si nous suivons cette procédure, nous n'avons pas besoin d'écrire les pages de données vers le disque à chaque validation de transaction car nous savons que, dans l'éventualité d'une défaillance, nous serons capables de récupérer la base de données en utilisant le journal : chaque changement qui n'a pas été appliqué aux pages de données peut être ré-exécuté depuis les enregistrements du journal (ceci est une récupération roll-forward, aussi connue sous le nom de REDO).
Comme les journaux de transaction permettent de restaurer le contenu des
fichiers de base de données après un arrêt brutal, les systèmes de
fichiers journalisés ne sont pas nécessaires pour stocker avec fiabilité
les fichiers de données ou les journaux de transactions. En fait, la
surcharge causée par la journalisation peut réduire les performances,
tout spécialement si la journalisation fait que les
données du système de fichiers sont envoyées sur
disque. Heureusement, l'envoi des données lors de la journalisation
peut souvent être désactivé avec une option de montage du système de
fichiers, par exemple data=writeback
sur un système de
fichiers Linux ext3. Par contre, les systèmes de fichiers journalisés
améliorent la rapidité au démarrage après un arrêt brutal.
Utiliser les journaux de transaction permet de réduire de façon
significative le nombre d'écritures sur le disque puisque seul le journal
a besoin d'être écrit sur le disque pour garantir qu'une
transaction a été validée plutôt que d'écrire dans chaque fichier de
données modifié par la transaction. Ce journal est écrit séquentiellement
ce qui fait que le coût de synchronisation du journal est largement moindre
que le coût d'écriture des pages de données. Ceci est tout spécialement
vrai pour
les serveurs gérant beaucoup de petites transactions touchant différentes
parties du stockage de données. De plus, quand le serveur traite plein de
petites transactions en parallèle, un fsync
du
journal des transactions devrait suffire pour enregistrer plusieurs
transactions.
Les journaux de transaction rendent possible le support de sauvegarde en ligne et de récupération à un moment, comme décrit dans la Section 25.3. En archivant les journaux de transaction, nous pouvons supporter le retour à tout instant couvert par les données disponibles dans les journaux de transaction : nous installons simplement une ancienne sauvegarde physique de la base de données et nous rejouons les journaux de transaction jusqu'au moment désiré. Qui plus est, la sauvegarde physique n'a pas besoin d'être une image instantanée de l'état de la base de données -- si elle a été faite pendant une grande période de temps, alors rejouer les journaux de transaction pour cette période corrigera toute incohérence interne.