pgvector (PostgreSQL Vector Extension)

pgvector est une extension PostgreSQL open source (MIT license) ajoutant le support natif des vecteurs et recherche par similarity directement dans Postgres. Devient extrêmement populaire en 2023-2024 car permet de consolider relational + vector data dans une seule database — éliminant la complexité d'opérer un vector DB séparé pour la plupart des use cases.

Installation : (1) `CREATE EXTENSION vector;` ; (2) supported nativement sur AWS RDS Postgres (depuis 2023), Aurora Postgres, Azure Database for PostgreSQL Flexible Server, Google Cloud SQL Postgres, AlloyDB, Supabase, Neon, Crunchy Bridge ; (3) self-hosted via pgvector GitHub repo.

Features : (1) **VECTOR(n) type** — stockage de vecteurs jusqu'à 16000 dimensions ; (2) **Distance operators** — `<->` (L2/Euclidean), `<#>` (negative dot product), `<=>` (cosine distance), `<+>` (L1/Manhattan, depuis v0.7) ; (3) **Indexes** — IVFFlat (faster build, lower recall) et HNSW (slower build, better recall — recommandé production depuis v0.5) ; (4) **Hybrid queries** combining vector search avec WHERE filters SQL classiques, JOINs, full-text search (tsvector), JSON queries ; (5) **Half-precision (float16) vectors** (pgvector 0.7) — 2x storage saving ; (6) **Binary vectors** (depuis 0.7) — int8 quantization ; (7) **HALFVEC, BIT, SPARSEVEC** types.

Exemple query : `SELECT id, name, embedding <=> '[0.1, 0.2, ...]' AS distance FROM products WHERE category = 'electronics' ORDER BY distance LIMIT 5;` — combine WHERE filter SQL natif avec vector similarity, impossible élégamment dans most vector DBs.

Force pgvector : (1) leverage existing Postgres expertise et infra ops ; (2) ACID transactions, joins, full SQL ecosystem (BI tools, ORMs) ; (3) backups et replication identiques à Postgres standard ; (4) cost-effective (existing Postgres instance vs nouveau vector DB) ; (5) data governance simplifiée (single source of truth).

Limitations : (1) performance inférieure à dedicated vector DBs pour 100M+ vectors ; (2) HNSW index build slow sur very large datasets ; (3) less features avancées (rerankers, embedding generation built-in absent — handle in app). Trade-off opérationnel vs performance ultime — pour la plupart RAG production sub-10M vectors, pgvector excellent choice. Compétences AI-102, DEA-C01.

Préparez vos certifications IT gratuitement