Box IA on-premise
Le boîtier d'IA générative qui reste chez vous
Une Box compacte, scellée, préchargée. Apple Silicon ou Linux x86 selon vos contraintes datacenter. Stack 100 % open-source. Aucune connexion sortante par défaut.
Silicon
Apple M3 Ultra
RAM unifiée
64–192 Go
Réseau
10 GbE
Air-gap
Compatible
Quatre tailles
Choisissez votre format
LMbox S
s
Pour équipes 20 à 40 personnes
RAM
64 Go
Users simultanés
jusqu'à 40
Débit
≈ 28 tok/s
Conso
65 W
12 000 €
Voir la fiche →
★ Le plus choisi
LMbox M
m
Pour ETI de 50 à 150 personnes
RAM
96 Go
Users simultanés
jusqu'à 150
Débit
≈ 52 tok/s
Conso
180 W
25 000 €
Voir la fiche →
LMbox L
l
Pour structures 150+ ou multi-sites
RAM
192 Go
Users simultanés
jusqu'à 400
Débit
≈ 85 tok/s
Conso
350 W
38 000 €
Voir la fiche →
LMbox XL
xl
Pour datacenter — modèles MoE frontière en local
RAM
1024 Go
Users simultanés
jusqu'à 1500
Débit
≈ 220 tok/s
Conso
3500 W
95 000 €
Voir la fiche →
Ce qu'il y a à l'intérieur
Une stack 100 % open-source, en 8 couches
Aucun composant propriétaire. Vous pouvez auditer, durcir, étendre. Tout est documenté et installable sur votre Box.
08
Plan de contrôle
Dashboard admin + orchestrateur de connecteurs. Santé temps réel des 19 services, audit logs cherchables, RGPD right-to-erasure, gestion multi-tenant.
lmbox-admin · orchestrator
07
Observabilité
Métriques (Prometheus), dashboards (Grafana), logs (Loki + Vector). Alertes par tier, export SIEM-ready vers Splunk / Elastic / Wazuh.
Prometheus · Grafana · Loki · Vector
06
Interface utilisateur
Une UI familière façon ChatGPT, accessible avec les identifiants entreprise. Multi-langues, multi-modèles, multi-modules.
Open WebUI
05
Passerelle modèles
Routage intelligent vers le bon modèle selon la tâche. Quotas, métriques, journalisation centralisés.
LiteLLM
04
Runtime d'inférence
Exécution des modèles open-source en local sur Apple Silicon ou GPU NVIDIA. Quantisation automatique selon la taille de Box.
Ollama · llama.cpp
03
Index documentaire
Postgres + extension vectorielle. Embeddings calculés localement sur les sources connectées (SharePoint, Drive, etc.).
Postgres + pgvector
02
Authentification entreprise
SSO Active Directory, Azure AD, Okta, Google Workspace via OIDC/SAML. RBAC fin par groupe, audit logs détaillés.
Authentik
01
Système hôte durci
macOS sur Apple Silicon ou Ubuntu LTS sur x86. Mise à jour signée, services minimaux, pare-feu restrictif par défaut.
macOS / Ubuntu LTS
Flux de données
Comment une requête voyage (et où elle ne va pas)
Le chemin d'une question, du clavier de l'utilisateur jusqu'à la réponse — entièrement à l'intérieur de votre LAN.
Utilisateur
SSO entreprise
LMbox
Index documentaire
Réponse sourcée
Aucune connexion sortante par défaut
Pas d'API tierce, pas de télémétrie, pas de modèle cloud appelé en backend. La Box peut tourner 100 % déconnectée d'internet (mode air-gap).
Ce que vous recevez
La Box, et tout ce qui va avec
Le boîtier scellé
Compact, préchargé avec les modèles, prêt à brancher. Numéro de série + signature SHA256 fournis.
Câbles et alim
Câble réseau 10 GbE, alimentation, câble Thunderbolt pour configuration initiale.
Runbook d'installation
Guide pas-à-pas papier + numérique. Procédures pour SSO Azure AD, Okta, Google Workspace.
Session d'onboarding
3 jours sur site avec un ingénieur LMbox. Formation utilisateurs incluse pour vos référents.
Admin dashboard inclus
Un seul écran pour piloter votre Box
Santé des 19 services, état des connecteurs, audit logs cherchables, sauvegardes Restic, gestion multi-tenant, RGPD right-to-erasure — tout dans une interface unique livrée d'origine.
https://lmbox.local/admin/
Services up
19 / 19
Connecteurs
14
Dernier backup
2 h
Disque libre
68 %
ollama
ok
litellm
ok
open-webui
ok
authentik
ok
lmbox-router
ok
lmbox-mcp
ok
prometheus + grafana
ok
loki + vector
ok
Santé temps réel
État de chaque service avec horodatage, code HTTP, métriques de latence. Détection automatique des dérives.
Sync connecteurs
Timeline par connecteur, dernière sync, nombre de docs indexés. Trigger d'une sync manuelle en un clic.
Audit logs cherchables
Recherche full-text sur tous les events (Loki + Vector). Export SIEM-ready (Splunk, Elastic, Wazuh).
RGPD right-to-erasure
Procédure d'effacement utilisateur en un formulaire avec phrase de confirmation. Trace exhaustive de chaque action.
Prêt à voir la Box dans votre contexte ?
Démo de 30 minutes sur vos cas d'usage prioritaires. POC payant 30 jours sur site, déductible si vous signez.