?
SkillintermédiaireVérifié le 2025-05

Vertex AI Search : RAG managé

Implémenter un système RAG complet avec Vertex AI Search sans infrastructure.

Vertex AI Search : RAG sans infrastructure

Vertex AI Search (anciennement Enterprise Search) est une solution RAG (Retrieval-Augmented Generation) entièrement managée. Elle permet de construire un système de recherche augmentée par IA sans gérer de base vectorielle ou de pipeline d'indexation.

Architecture

Documents → Vertex AI Search → Embedding + Index → Requête → Gemini + contexte → Réponse

Vertex AI Search gère automatiquement : - Le chunking des documents - La génération d'embeddings - L'indexation vectorielle - La recherche sémantique - La génération de réponses avec Gemini

Mise en place

1. Créer un datastore

from google.cloud import discoveryengine_v1 as discoveryengine

client = discoveryengine.DataStoreServiceClient()

datastore = client.create_data_store(
    parent="projects/mon-projet/locations/global/collections/default_collection",
    data_store=discoveryengine.DataStore(
        display_name="Ma base documentaire",
        industry_vertical=discoveryengine.IndustryVertical.GENERIC,
        content_config=discoveryengine.DataStore.ContentConfig.CONTENT_REQUIRED,
    ),
    data_store_id="mon-datastore"
)

2. Ingérer des documents

Sources supportées : - Google Cloud Storage (PDF, HTML, TXT) - BigQuery - Sites web (crawling automatique) - APIs (JSONL structuré)

3. Configurer la recherche

from google.cloud import discoveryengine_v1 as discoveryengine

client = discoveryengine.SearchServiceClient()

response = client.search(
    serving_config="projects/mon-projet/locations/global/collections/default_collection/dataStores/mon-datastore/servingConfigs/default_search",
    query="Comment configurer l'authentification SSO ?",
    page_size=5,
    content_search_spec=discoveryengine.SearchRequest.ContentSearchSpec(
        summary_spec=discoveryengine.SearchRequest.ContentSearchSpec.SummarySpec(
            summary_result_count=3,
            model_spec=discoveryengine.SearchRequest.ContentSearchSpec.SummarySpec.ModelSpec(
                version="gemini-2.5-flash"
            )
        )
    )
)

Avantages vs RAG custom

  • Pas de vector DB à gérer : Indexation automatique
  • Chunking optimisé : Algorithmes Google pour le découpage
  • Grounding natif : Citations automatiques avec sources
  • Mise à jour continue : Re-crawling et re-indexation automatiques
  • Scalabilité : Pas de limites pratiques de volume

Cas d'usage

  • Base de connaissances interne (documentation, wikis)
  • Support client augmenté par IA
  • Recherche sur corpus réglementaire
  • Assistant de recherche pour analystes

Bonnes pratiques

  • Structurez vos documents avec des titres et métadonnées
  • Testez la qualité de recherche avec des requêtes réelles
  • Utilisez les filtres de métadonnées pour affiner les résultats
  • Surveillez les métriques de pertinence en production

Sources

VertexRAGsearch