PostgreSQLLa base de données la plus sophistiquée au monde.
Documentation PostgreSQL 10.23 » Annexes » Modules supplémentaires fournis » intarray

F.19. intarray

Le module intarray fournit un certain nombre de fonctions et d'opérateurs utiles pour manipuler des tableaux d'entiers sans valeurs NULL. Il y a aussi un support pour les recherches par index en utilisant certains des opérateurs.

Toutes ces opérations rejeteront une erreur si un tableau fourni contient des éléments NULL.

La plupart des opérations sont seulement intéressants pour des tableaux à une dimension. Bien qu'elles accepteront des tableaux à plusieurs dimensions, les données sont traitées comme s'il y avait un tableau linéaire.

F.19.1. Fonctions et opérateurs d'intarray

Les fonctions fournies par le module intarray sont affichées dans Tableau F.10 alors que les opérateurs sont indiqués dans Tableau F.11.

Tableau F.10. Fonctions intarray

FonctionType en retourDescriptionExempleRésultat
icount(int[])intnombre d'éléments dans un tableauicount('{1,2,3}'::int[])3
sort(int[], text dir)int[]tri du tableau -- dir doit valoir asc ou descsort('{1,2,3}'::int[], 'desc'){3,2,1}
sort(int[])int[]tri en ordre ascendantsort(array[11,77,44]){11,44,77}
sort_asc(int[])int[]tri en ordre descendant
sort_desc(int[])int[]tri en ordre descendant
uniq(int[])int[]supprime les duplicats adjacentsuniq(sort('{1,2,3,2,1}'::int[])){1,2,3}
idx(int[], int item)intindex du premier élément correspondant à item (0 si aucune correspondance)idx(array[11,22,33,22,11], 22)2
subarray(int[], int start, int len)int[]portion du tableau commençant à la position start, de longueur lensubarray('{1,2,3,2,1}'::int[], 2, 3){2,3,2}
subarray(int[], int start)int[]portion du tableau commençant à la position startsubarray('{1,2,3,2,1}'::int[], 2){2,3,2,1}
intset(int)int[]crée un tableau à un élémentintset(42){42}

Tableau F.11. Opérateurs d'intarray

OpérateurRenvoieDescription
int[] && int[]booleansurcharge -- true si les tableaux ont au moins un élément en commun
int[] @> int[]booleancontient -- true si le tableau gauche contient le tableau droit
int[] <@ int[]booleanest contenu -- true si le tableau gauche est contenu dans le tableau droit
# int[]intnombre d'éléments dans le tableau
int[] # intintindex (identique à la fonction idx)
int[] + intint[]pousse l'élément dans le tableau (l'ajoute à la fin du tableau)
int[] + int[] int[]concaténation de tableau (le tableau à droite est ajouté à la fin du tableau à gauche)
int[] - intint[]supprime les entrée correspondant à l'argument droit du tableau
int[] - int[]int[]supprime les éléments du tableau droit à partir de la gauche
int[] | intint[]union des arguments
int[] | int[]int[]union des tableaux
int[] & int[]int[]intersection des tableaux
int[] @@ query_intbooleantrue si le tableau satisfait la requête (voir ci-dessous)
query_int ~~ int[]booleantrue si le tableau satisfait la requête (commutateur de @@)

(Avant PostgreSQL 8.2, les opérateurs de contenance @> et <@ étaient respectivement appelés @ et ~. Ces noms sont toujours disponibles mais sont considérés comme obsolètes et seront un jour supprimés. Notez que les anciens noms sont inversés par rapport à la convention suivie par les types de données géométriques !)

Les opérateurs &&, @> et <@ sont équivalents aux opérateurs internes PostgreSQL de même nom, sauf qu'ils travaillent sur des tableaux d'entiers, sans valeurs NULL, alors que les opérateurs internes travaillent sur des tableaux de tout type. Cette restriction les rend plus rapides que les opérateurs internes dans de nombreux cas.

Les opérateurs @@ et ~~ testent si un tableau satisfait une requête, qui est exprimée comme une valeur d'un type de données spécialisé query_int. Une requête consiste en des valeurs de type integer qui sont vérifiées avec les éléments du tableau, parfois combinées en utilisant les opérateurs & (AND), | (OR) et ! (NOT). Les parenthèses peuvent être utilisées si nécessaire. Par exemple, la requête 1&(2|3) établit une correspondance avec les tableaux qui contiennent 1 et aussi soit 2 soit 3.

F.19.2. Support des index

intarray fournit un support d'index pour les opérateurs &&, @>, <@ et @@, ainsi que pour l'égalité de tableaux.

Deux classes d'opérateur pour index GiST sont fournies : gist__int_ops (utilisé par défaut) convient pour des tableaux d'ensembles de données de petites et moyennes tailles alors que gist__intbig_ops utilise une signature plus importante et est donc plus intéressant pour indexer des gros ensembles de données. (c'est-à-dire les colonnes contenant un grand nombre de valeurs de tableaux distinctes). L'implantation utilise une structure de données RD-tree avec une compression interne à perte.

Il y a aussi une classe d'opérateur GIN,gin__int_ops supportant les mêmes opérateurs, qui n'est pas disponible par défaut.

Le choix d'un indexage GiST ou IN dépend des caractéristiques relatives de performance qui sont discutées ailleurs.

F.19.3. Exemple

-- un message peut être dans un ou plusieurs « sections »
CREATE TABLE message (mid INT PRIMARY KEY, sections INT[], ...);

-- crée un index spécialisé
CREATE INDEX message_rdtree_idx ON message USING GIST (sections gist__int_ops);

-- sélectionne les messages dans la section 1 ou 2 - opérateur OVERLAP
SELECT message.mid FROM message WHERE message.sections && '{1,2}';

-- sélectionne les messages dans sections 1 et 2 - opérateur CONTAINS
SELECT message.mid FROM message WHERE message.sections @> '{1,2}';

-- idem, en utilisant l'opérateur QUERY
SELECT message.mid FROM message WHERE message.sections @@ '1&2'::query_int;
  

F.19.4. Tests de performance

Le répertoire des sources (contrib/intarray/bench) contient une suite de tests de performance, qui peut être exécutée sur un serveur PostgreSQL déjà installé. (Cela nécessite aussi l'installation de DBD::Pg.). Pour l'exécuter :

   cd .../contrib/intarray/bench
   createdb TEST
   psql -c "CREATE EXTENSION intarray" TEST
   ./create_test.pl | psql TEST
   ./bench.pl
  

Le script bench.pl contient un grand nombre d'options. Elles sont affichées quand il est exécuté sans arguments.

F.19.5. Auteurs

Ce travail a été réalisé par Teodor Sigaev () et Oleg Bartunov (). Voir le site de GiST pour des informations supplémentaires. Andrey Oktyabrski a fait un gros travail en ajoutant des nouvelles fonctions et opérateurs.