Ingénieur Système/Ops senior (7+ ans : public, luxe, retail, VFX) pivoté vers l'IA appliquée. J'exploite en continu un système multi-agents qui administre une vraie infrastructure Proxmox — pas un POC : une preuve vivante d'orchestration d'agents, de LLMOps et d'IA 100 % souveraine. A senior Systems/Ops engineer (7+ years across critical public-sector, luxury, retail and VFX) who pivoted into applied AI. I run a live multi-agent system that administers a real Proxmox infrastructure — not a toy POC, but living proof of agent orchestration, LLMOps and fully sovereign AI.
Tous les chiffres sont mesurés et tracés. Les limites sont assumées — c'est le meilleur signal anti-bullshit sur un marché saturé.Every figure is measured and sourced. Limits are owned — the best anti-bullshit signal in a saturated market.
Problème. Administrer une infra homelab réelle (Proxmox, 17 conteneurs, 3 VLANs) demande une vigilance 24/7. Comment déléguer ce « Run » à un agent LLM sans perdre le contrôle ni la fiabilité ? Problem. Running a real homelab (Proxmox, 17 containers, 3 VLANs) demands 24/7 vigilance. How do you delegate that "Run" workload to an LLM agent without losing control or reliability?
Problème. Un agent sur modèle cloud = coût récurrent + dépendance. Peut-on le faire tourner sur un LLM 100 % local (0 token cloud) sans sacrifier fiabilité ni vitesse — et choisir le modèle objectivement ? Problem. An agent on a cloud model = recurring cost + dependency. Can it run on a 100% local LLM (zero cloud tokens) without losing reliability or speed — and pick the model objectively?
Problème. Avant d'orchestrer des agents, il faut un substrat fiable, sécurisé et observable. Sans télémétrie, pas d'AIOps. Problem. Before orchestrating agents you need a reliable, secure, observable substrate. Without telemetry, no AIOps.
Problème. Un agent fiable a besoin de mémoire sémantique et d'un accès outillé standardisé à ses sources — sans envoyer les données dans le cloud. Problem. A reliable agent needs semantic memory and standardized tooled access to its sources — without sending data to the cloud.
memorySearch natif + Ollama. Présenté au passé, chiffre non gonflé (2411, pas « des millions »).
Archived POC. The JimDB container has since been destroyed; the target is native memorySearch + Ollama. Presented in the past tense, figure not inflated (2,411, not "millions").Problème. Les PME veulent de l'IA utile mais craignent l'envoi de leurs données dans le cloud (RGPD, Cloud Act). Comment packager une IA souveraine, abordable et gouvernée ? Problem. SMBs want useful AI but fear sending data to the cloud (GDPR, Cloud Act). How do you package sovereign, affordable, governed AI?
Conception multi-agents superviseur/exécutant (Jim ↔ Harry) · crons autonomes 24/7 · fallback multi-modèles · sub-agents concurrents · matrice de permissions N1-N4 + human-in-the-loop · skills modulaires.Supervisor/worker multi-agent design (Jim ↔ Harry) · 24/7 autonomous crons · multi-model fallback · concurrent sub-agents · N1-N4 permission matrix + human-in-the-loop · modular skills.
Via OpenClaw / Hermes + tooling custom — LangChain/LangGraph non revendiqués comme frameworks.Via OpenClaw / Hermes + custom tooling — LangChain/LangGraph not claimed as frameworks.Bascule cloud → local (MLX, Qwen) · runtimes MLX & Ollama (Apple Silicon) + LM Studio (GPU AMD RX 6800XT, Vulkan) = local cross-platform · prompt caching · harness de benchmark (BFCL, safety) · tuning d'inférence mesuré (3×-11×) · red-teaming & hardening · 0 token cloud.Cloud → local cutover (MLX, Qwen) · MLX & Ollama runtimes (Apple Silicon) + LM Studio (AMD RX 6800XT GPU, Vulkan) = cross-platform local · prompt caching · benchmark harness (BFCL, safety) · measured inference tuning (3×-11×) · red-teaming & hardening · zero cloud tokens.
Pas de fine-tuning/training ; local cross-platform (Apple Silicon + AMD).No fine-tuning/training; cross-platform local (Apple Silicon + AMD).Observabilité full-stack (Checkmk 16 hosts/~400 services, Prometheus/Grafana, Uptime Kuma, ELK en mission) · corrélation de logs · incident management & RCA · vision d'enrichissement d'alertes par LLM.Full-stack observability (Checkmk 16 hosts/~400 services, Prometheus/Grafana, Uptime Kuma, ELK on assignment) · log correlation · incident management & RCA · LLM-augmented alerting vision.
AIOps = R&D/direction soutenue par la télémétrie, pas un produit livré.AIOps = telemetry-backed R&D, not a shipped product.Orchestration à grande échelle (SaltStack 180 minions, Ansible) · industrialisation PowerShell (20+ scripts) · GitOps · MCP (3 serveurs) · Python Avancé (FastAPI, RAG) · PostgreSQL + pgvector · Cloud public Intermédiaire.Large-scale orchestration (SaltStack 180 minions, Ansible) · PowerShell industrialization (20+ scripts) · GitOps · MCP (3 servers) · Advanced Python (FastAPI, RAG) · PostgreSQL + pgvector · Intermediate public cloud.
IaC via Ansible/GitOps — pas Terraform/Kubernetes en prod.IaC via Ansible/GitOps — not Terraform/Kubernetes in production.Orchestration d'agents · LLM local / privacy · AIOps — Freelance (SASU), Paris & Remote, 7+ ans.Agent orchestration · local / private LLM · AIOps — Freelance (SASU), Paris & Remote, 7+ years.