Open WebUI : interface ChatGPT pour vos modèles locaux
Open WebUI est une interface web open source qui offre une expérience similaire à ChatGPT pour interagir avec vos modèles locaux (Ollama, vLLM, ou toute API compatible OpenAI).
Installation
Avec Docker (recommandé)
# Si Ollama tourne sur la même machine
docker run -d \
-p 3000:8080 \
--add-host=host.docker.internal:host-gateway \
-v open-webui:/app/backend/data \
--name open-webui \
ghcr.io/open-webui/open-webui:mainAccédez à http://localhost:3000 et créez votre compte admin.
Avec pip
pip install open-webui
open-webui serveConfiguration
Connecter Ollama
Open WebUI détecte automatiquement Ollama s'il tourne sur localhost:11434. Sinon, configurez l'URL dans Settings > Connections.
Connecter vLLM ou autre API
Dans Settings > Connections > OpenAI API : - URL : http://localhost:8000/v1 - Clé API : (votre clé ou "unused")
Fonctionnalités
Chat
- Conversations multi-tours avec historique
- Changement de modèle en cours de conversation
- Réponses en streaming
- Formatage Markdown et code
Documents (RAG)
- Upload de fichiers PDF, TXT, DOCX
- Recherche sémantique dans vos documents
- Citations automatiques des sources
- Collections de documents organisables
Outils avancés
- Génération d'images (si DALL-E ou Stable Diffusion configuré)
- Recherche web intégrée
- Exécution de code
- Synthèse vocale et dictée
Administration
- Gestion des utilisateurs et rôles
- Quotas par utilisateur
- Logs d'utilisation
- Modèles autorisés par rôle
Personnalisation
Prompts système
Configurez des prompts système par défaut pour chaque modèle ou créez des "presets" pour différents cas d'usage.
Modelfiles
Créez des assistants spécialisés directement dans l'interface : - Assistant juridique - Correcteur de code - Rédacteur marketing
Déploiement équipe
# docker-compose.yml pour une équipe
services:
ollama:
image: ollama/ollama
deploy:
resources:
reservations:
devices:
- capabilities: [gpu]
open-webui:
image: ghcr.io/open-webui/open-webui:main
ports:
- "3000:8080"
environment:
- OLLAMA_BASE_URL=http://ollama:11434Bonnes pratiques
- Activez l'authentification pour un déploiement multi-utilisateurs
- Configurez des limites de tokens par conversation
- Sauvegardez régulièrement le volume de données
- Mettez à jour régulièrement (développement actif)