?
GuideavancéVérifié le 2025-05

Vertex AI : déployer Gemini en entreprise

Guide de déploiement de Gemini sur Vertex AI avec sécurité et compliance.

Vertex AI : Gemini pour l'entreprise

Vertex AI est la plateforme ML managée de Google Cloud qui permet de déployer Gemini avec les garanties de sécurité, compliance et scalabilité requises en entreprise.

Pourquoi Vertex AI vs AI Studio ?

  • SLA : Garanties de disponibilité pour la production
  • Sécurité : VPC-SC, CMEK, IAM granulaire
  • Compliance : SOC2, ISO 27001, HIPAA eligible
  • Scalabilité : Quotas élevés, provisioned throughput
  • Gouvernance : Logging, audit trail, data residency

Architecture de déploiement

Composants clés

  • Endpoint Gemini : Point d'accès API managé
  • IAM : Contrôle d'accès par rôle et service account
  • VPC-SC : Périmètre de sécurité réseau
  • Cloud Logging : Traçabilité de toutes les requêtes
  • Cloud Monitoring : Alertes sur latence, erreurs, quotas

Exemple d'appel via le SDK

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project="mon-projet", location="europe-west1")

model = GenerativeModel("gemini-2.5-pro")
response = model.generate_content(
    "Analyse ce rapport financier",
    generation_config={"temperature": 0.1}
)

Sécurité et compliance

Data residency

  • Choisissez la région de processing (europe-west1 pour la France)
  • Les données ne quittent pas la région sélectionnée
  • Pas de rétention des données par Google pour l'entraînement

Contrôle d'accès

  • Service accounts dédiés par application
  • Rôles prédéfinis : Vertex AI User, Admin, Viewer
  • Conditions IAM pour limiter l'accès par IP ou horaire

Chiffrement

  • Chiffrement en transit (TLS 1.3) et au repos par défaut
  • CMEK : Apportez vos propres clés de chiffrement
  • Intégration avec Cloud KMS

Bonnes pratiques de déploiement

  • Utilisez des service accounts dédiés (pas de comptes utilisateur)
  • Activez Cloud Audit Logs pour la traçabilité
  • Configurez des alertes sur les quotas et la latence
  • Implémentez un circuit breaker côté client
  • Testez le failover entre régions pour la haute disponibilité

Coûts

  • Facturation à l'usage (tokens input/output)
  • Provisioned throughput pour des coûts prévisibles
  • Committed use discounts disponibles pour gros volumes

Sources

Vertexentreprisedéploiement