Les limites actuelles de la recherche plein texte de PostgreSQL sont :
La longueur de chaque lexème doit être inférieure à 2 Ko
La longueur d'un tsvector
(lexèmes + positions) doit
être inférieure à 1 Mo
Le nombre de lexèmes doit être inférieur à 264
Les valeurs de position dans un tsvector
doivent
être supérieures à 0 et inférieures ou égales à 16383
La distance de correspondance dans un opérateur
tsquery
<
(FOLLOWED BY) ne
peut pas dépasser 16384N
>
Pas plus de 256 positions par lexème
Le nombre de nœuds (lexèmes + opérateurs) dans un tsquery
doit être inférieur à 32768
Pour comparaison, la documentation de PostgreSQL 8.1 contient 10441 mots uniques, un total de 335420 mots, et le mot le plus fréquent, « postgresql », est mentionné 6127 fois dans 655 documents.
Un autre exemple -- les archives de la liste de discussions de PostgreSQL contenaient 910989 mots uniques avec 57491343 lexèmes dans 461020 messages.