L'Atelier — Réseau francophone IA (produit, tech, business)

Vertex AI Search : RAG sans infrastructure

Vertex AI Search (anciennement Enterprise Search) est une solution RAG (Retrieval-Augmented Generation) entièrement managée. Elle permet de construire un système de recherche augmentée par IA sans gérer de base vectorielle ou de pipeline d'indexation.

Architecture

Documents → Vertex AI Search → Embedding + Index → Requête → Gemini + contexte → Réponse

Vertex AI Search gère automatiquement : - Le chunking des documents - La génération d'embeddings - L'indexation vectorielle - La recherche sémantique - La génération de réponses avec Gemini

Mise en place

1. Créer un datastore

from google.cloud import discoveryengine_v1 as discoveryengine

client = discoveryengine.DataStoreServiceClient()

datastore = client.create_data_store(
    parent="projects/mon-projet/locations/global/collections/default_collection",
    data_store=discoveryengine.DataStore(
        display_name="Ma base documentaire",
        industry_vertical=discoveryengine.IndustryVertical.GENERIC,
        content_config=discoveryengine.DataStore.ContentConfig.CONTENT_REQUIRED,
    ),
    data_store_id="mon-datastore"
)

2. Ingérer des documents

Sources supportées : - Google Cloud Storage (PDF, HTML, TXT) - BigQuery - Sites web (crawling automatique) - APIs (JSONL structuré)

3. Configurer la recherche

from google.cloud import discoveryengine_v1 as discoveryengine

client = discoveryengine.SearchServiceClient()

response = client.search(
    serving_config="projects/mon-projet/locations/global/collections/default_collection/dataStores/mon-datastore/servingConfigs/default_search",
    query="Comment configurer l'authentification SSO ?",
    page_size=5,
    content_search_spec=discoveryengine.SearchRequest.ContentSearchSpec(
        summary_spec=discoveryengine.SearchRequest.ContentSearchSpec.SummarySpec(
            summary_result_count=3,
            model_spec=discoveryengine.SearchRequest.ContentSearchSpec.SummarySpec.ModelSpec(
                version="gemini-2.5-flash"
            )
        )
    )
)

Avantages vs RAG custom

Pas de vector DB à gérer : Indexation automatique
Chunking optimisé : Algorithmes Google pour le découpage
Grounding natif : Citations automatiques avec sources
Mise à jour continue : Re-crawling et re-indexation automatiques
Scalabilité : Pas de limites pratiques de volume

Cas d'usage

Base de connaissances interne (documentation, wikis)
Support client augmenté par IA
Recherche sur corpus réglementaire
Assistant de recherche pour analystes

Bonnes pratiques

Structurez vos documents avec des titres et métadonnées
Testez la qualité de recherche avec des requêtes réelles
Utilisez les filtres de métadonnées pour affiner les résultats
Surveillez les métriques de pertinence en production

Vertex AI Search : RAG managé