Où va votre budget en IA locale ?
L'IA locale a une logique inversée par rapport aux autres métiers créatifs : la VRAM décide de presque tout. Prenez 5 minutes - c'est ce qui fait la différence entre un PC qui peut faire tourner les modèles que vous voulez, et un PC qui plantera dès que vous chargerez un LLM 70B ou un workflow ComfyUI complexe.
Le GPU - le seul composant qui détermine vraiment vos capacités
En IA locale, c’est binaire : soit votre GPU peut charger le modèle, soit il ne peut pas. Pas de demi-mesure. Et ce qui détermine cette capacité, c’est principalement la VRAM, ensuite la puissance brute de calcul (TFLOPs), et l’écosystème logiciel.
NVIDIA reste hégémonique en IA locale en 2026 grâce à CUDA. AMD progresse via ROCm mais reste compliqué pour les usages variés. Si vous démarrez en IA locale, partir sur NVIDIA évite des heures de configuration et de bugs.
Nos repères VRAM en 2026 :
- 12 Go (RTX 5070) – le plancher pour Stable Diffusion 1.5/SDXL, petits LLM 7-13B quantisés
- 16 Go (RTX 5070 Ti / 5080) – confort pour SDXL, Flux Schnell, LLM 13B en pleine précision, fine-tuning LoRA
- 24 Go (RTX 5090) – Flux Dev, ComfyUI complexe, LLM 30B quantisés, génération vidéo (Wan, Hunyuan)
- 32 Go (RTX 5090 32 Go) – LLM 70B quantisés Q4, vidéo IA longue durée, fine-tuning sérieux
- 48-96 Go (RTX Pro 6000 Blackwell) – inférence LLM 70B+ pleine précision, entraînement, recherche
Sur la question multi-GPU : pour faire tourner Llama 70B en local, deux RTX 5090 24Go sont moins chères qu’une RTX Pro 6000 48Go. Mais le multi-GPU complique la config (alimentation, refroidissement, support framework). On en discute selon votre cas réel d’usage.
Le CPU - secondaire mais pas négligeable
Contrairement aux idées reçues, le CPU joue un rôle réel en IA locale même quand le calcul est sur GPU. Il gère le chargement initial des modèles en mémoire, le preprocessing des données (tokenisation, embeddings), et l’orchestration des workflows ComfyUI multi-étapes.
Nos repères en 2026 :
- Ryzen 7 / Core Ultra 7 – suffisant pour usage IA local “consommateur” (génération image, inférence LLM)
- Ryzen 9 / Core Ultra 9 – le standard pour usage IA pro (RAG, pipelines complexes, dev de prototypes)
- Threadripper PRO – utile uniquement pour entraînement, dataset processing massif, ou multi-GPU 4+ cartes (lignes PCIe)
À noter pour le multi-GPU : si vous prévoyez 2 GPU ou plus, les lignes PCIe disponibles deviennent critiques. Un Ryzen 9 sur AM5 offre 24 lignes utiles, un Threadripper PRO en offre 128. Pour 2 GPU c’est gérable sur grand public, pour 4 GPU il faut passer en station de travail.
La RAM - la règle des 2x VRAM
En IA locale, une règle simple guide le dimensionnement RAM : visez environ 2× la VRAM totale de votre système. Quand un modèle est chargé en VRAM, une copie temporaire passe par la RAM système, et les outils comme ComfyUI ou Ollama gèrent leurs caches en RAM.
Nos repères en 2026 :
- 32 Go – le plancher pour usage IA “léger” (Stable Diffusion, petits LLM, RTX 5070)
- 64 Go – le standard pour ComfyUI complexe, LLM 13-30B, RTX 5080/5090
- 128 Go – inférence LLM 70B, multi-GPU 24-32 Go, fine-tuning local
- 256 Go+ – entraînement, LLM 70B+ pleine précision, recherche ML, dataset processing
À noter : pour les modèles vraiment massifs (LLM 70B+, certains modèles de génération vidéo), la RAM système peut servir de débordement quand la VRAM sature – via les techniques d’offloading. Une RAM abondante permet alors de faire tourner des modèles techniquement “trop gros” pour votre GPU, au prix d’une vitesse plus faible.
Le stockage - massif et rapide
En IA locale, le stockage devient rapidement un sujet majeur. Les modèles modernes pèsent lourd : un LLM 70B en pleine précision fait 140 Go, un modèle Flux complet pèse 23 Go, une checkpoint Stable Diffusion XL pèse 6-7 Go. Si vous accumulez des modèles, des LoRA et des datasets, vous saturez rapidement.
Notre recommandation type :
- SSD NVMe Gen4/Gen5 2 To – système, environnements Python, projets actifs
- SSD NVMe secondaire 4 To – dédié aux modèles IA actuellement utilisés (chargement rapide)
- Stockage de masse 8 To+ – bibliothèque de modèles archivés, datasets, checkpoints rarement utilisés
La vitesse du SSD compte au moment du chargement : un Llama 70B met 3 secondes à charger sur un Gen5, vs 15 secondes sur un SATA. Sur des sessions de prototypage où vous changez de modèle régulièrement, c’est un gain de productivité réel.
Ce qui ne sert à rien (ou presque) en IA locale
Autant être honnête : on voit régulièrement des PC “IA” vendus avec des composants déséquilibrés.
- Une RTX 5070 Ti 16 Go avec un Threadripper – vous payez le CPU pour rien si votre GPU ne suit pas. En IA, le budget va d’abord au GPU, ensuite au reste.
- RTX Gaming “pour faire de l’entraînement” – les RTX gaming n’ont pas la VRAM ni l’ECC pour de l’entraînement sérieux. Si vous entraînez vraiment, il faut viser RTX Pro 6000 ou louer du cloud (AWS, Lambda Labs) pour les gros runs.
- RAM ECC pour usage personnel – utile pour entraînement long sur datasets critiques, inutile pour de l’inférence ou de la génération.
- Le RGB partout – aucune incidence sur ComfyUI ou Ollama. Si vous aimez, on en met. Sinon, économie réinvestie en VRAM.
Notre règle : en IA, le GPU mange 50-70% du budget. C’est inversé par rapport aux autres métiers, et c’est normal. On vous le dit clairement quand un composant que vous envisagez n’apporte rien à votre usage IA réel.
À partir de quel budget ?
Quatre paliers pour situer votre projet. Pas de prix figés - chaque config est dimensionnée à votre usage, et ces fourchettes évoluent avec le marché des composants.
Démarrage IA locale. Stable Diffusion, SDXL, petits LLM 7-13B quantisés. RTX 5070 Ti 16 Go, RAM 32 Go, double SSD.
Usage IA pro régulier. Flux Dev, ComfyUI complexe, LLM 30B, génération vidéo. RTX 5090 24-32 Go, RAM 64-128 Go.
LLM 70B en local, dual-GPU, fine-tuning sérieux. RAM 128-256 Go, stockage massif. Rapport de tests détaillé remis à la livraison.
Recherche ML, entraînement de modèles, multi-GPU 4 cartes, RTX Pro 6000, infrastructure ECC. Votre projet relève de notre offre Workstations sur mesure.
Comment on travaille ensemble
De votre première demande à la livraison de votre machine, voici le parcours.
Vous remplissez le formulaire (ou appelez Nicolas)
Conçu pour qu’on récupère en une fois les informations nécessaires pour chiffrer précisément votre besoin : logiciels, usage, budget, délais.
Nicolas étudie votre demande
Vous recevez un devis chiffré personnalisé sous 24h ouvrées. Pas un tarif sorti d’un catalogue, une configuration réfléchie pour votre pipeline précis.
On ajuste ensemble si besoin
Un aller-retour par mail, un coup de fil pour préciser, arbitrer sur un composant, discuter d’une alternative. On ne vous pousse pas à signer – on prend le temps qu’il faut.
Validation du devis et acompte
40% à la commande pour les projets au-delà de 15 000€, paiement comptant à la livraison pour les projets en dessous. Virement, carte, paiement plusieurs fois selon le montant.
Assemblage et tests à Besançon
Chaque machine est testée en charge : stabilité CPU/GPU, températures, benchmarks adaptés à votre usage. Pour les projets 10 000€+, un rapport de tests PDF est remis à la livraison.
Livraison ou retrait atelier
Retrait gratuit à Besançon, livraison France métropolitaine sécurisée, ou installation sur site dans un rayon de 2h autour de Besançon (sur devis).
Ce sur quoi vous pouvez compter
Devis sous 24h
Étudié par Nicolas, co-fondateur. Devis chiffré précis, pas un tarif générique.
Configuration sur mesure
Pas de catalogue pré-fait. Chaque machine est dimensionnée à votre logiciel principal.
Assemblage à Besançon
Monté manuellement dans notre atelier, par les deux co-fondateurs. Zéro sous-traitance.
Tests avant livraison
Benchmarks et tests de stabilité systématiques. Rapport PDF pour projets 10 000€+.
SAV prioritaire et humain
Vous appelez directement Nicolas ou Yoann. Pas de hotline. Traitement prioritaire.
Une question avant de remplir le formulaire ?
Appelez Nicolas directement. 5 minutes au téléphone valent souvent mieux qu’un long questionnaire – surtout si votre projet est complexe ou si vous hésitez sur des choix techniques.
Recevez votre devis personnalisé
Remplissez ce formulaire — Nicolas vous revient sous 24h ouvrées avec une configuration chiffrée, adaptée à votre pipeline.
Besoin d'une configuration pour un autre métier ?
Découvrez nos autres pages métier ou notre offre Workstations sur mesure pour les très gros projets.
3D & animation
PC pour Blender, Cinema 4D, Maya, Houdini, Unreal Engine.
Architecture & CAO
PC pour Revit, AutoCAD, SketchUp, Twinmotion, Lumion.
Montage vidéo
PC pour DaVinci Resolve, Premiere Pro, After Effects.
MAO & production musicale
PC pour Cubase, Ableton, Pro Tools, FL Studio.
2D & illustration
PC pour Photoshop, Illustrator, Clip Studio, Krita.
Workstations sur mesure
Multi-GPU, Threadripper PRO, RAM ECC. Dès 15 000€.




