Vertex AI Search : RAG sans infrastructure
Vertex AI Search (anciennement Enterprise Search) est une solution RAG (Retrieval-Augmented Generation) entièrement managée. Elle permet de construire un système de recherche augmentée par IA sans gérer de base vectorielle ou de pipeline d'indexation.
Architecture
Documents → Vertex AI Search → Embedding + Index → Requête → Gemini + contexte → RéponseVertex AI Search gère automatiquement : - Le chunking des documents - La génération d'embeddings - L'indexation vectorielle - La recherche sémantique - La génération de réponses avec Gemini
Mise en place
1. Créer un datastore
from google.cloud import discoveryengine_v1 as discoveryengine
client = discoveryengine.DataStoreServiceClient()
datastore = client.create_data_store(
parent="projects/mon-projet/locations/global/collections/default_collection",
data_store=discoveryengine.DataStore(
display_name="Ma base documentaire",
industry_vertical=discoveryengine.IndustryVertical.GENERIC,
content_config=discoveryengine.DataStore.ContentConfig.CONTENT_REQUIRED,
),
data_store_id="mon-datastore"
)2. Ingérer des documents
Sources supportées : - Google Cloud Storage (PDF, HTML, TXT) - BigQuery - Sites web (crawling automatique) - APIs (JSONL structuré)
3. Configurer la recherche
from google.cloud import discoveryengine_v1 as discoveryengine
client = discoveryengine.SearchServiceClient()
response = client.search(
serving_config="projects/mon-projet/locations/global/collections/default_collection/dataStores/mon-datastore/servingConfigs/default_search",
query="Comment configurer l'authentification SSO ?",
page_size=5,
content_search_spec=discoveryengine.SearchRequest.ContentSearchSpec(
summary_spec=discoveryengine.SearchRequest.ContentSearchSpec.SummarySpec(
summary_result_count=3,
model_spec=discoveryengine.SearchRequest.ContentSearchSpec.SummarySpec.ModelSpec(
version="gemini-2.5-flash"
)
)
)
)Avantages vs RAG custom
- Pas de vector DB à gérer : Indexation automatique
- Chunking optimisé : Algorithmes Google pour le découpage
- Grounding natif : Citations automatiques avec sources
- Mise à jour continue : Re-crawling et re-indexation automatiques
- Scalabilité : Pas de limites pratiques de volume
Cas d'usage
- Base de connaissances interne (documentation, wikis)
- Support client augmenté par IA
- Recherche sur corpus réglementaire
- Assistant de recherche pour analystes
Bonnes pratiques
- Structurez vos documents avec des titres et métadonnées
- Testez la qualité de recherche avec des requêtes réelles
- Utilisez les filtres de métadonnées pour affiner les résultats
- Surveillez les métriques de pertinence en production