Face aux modèles d'IA géants, les PC classiques montrent leurs limites. De nouvelles workstations spécialisées promettent d'amener la puissance des grands modèles directement sur le bureau des dirigeants.
Quand les PC traditionnels atteignent leurs l…
© L'entreprise Intelligente
Face aux modèles d'IA géants, les PC classiques montrent leurs limites. De nouvelles workstations spécialisées promettent d'amener la puissance des grands modèles directement sur le bureau des dirigeants.
Quand les PC traditionnels atteignent leurs limites
L'essor de l'IA générative révèle une réalité technique contraignante pour les entreprises : les ordinateurs classiques ne suffisent plus. Selon IEEE Spectrum (États-Unis), un laptop typique ne peut charger qu'un modèle de langage de 8 à 13 milliards de paramètres, bien loin des modèles frontières qui dépassent le trillion de paramètres. Même les workstations PC les plus performantes peinent avec des modèles dépassant 70 milliards de paramètres.
Cette limitation technique pose un défi concret aux PME françaises qui souhaitent exploiter l'IA sans dépendre des services cloud. Entre souveraineté numérique et contrôle des coûts d'usage, l'IA locale devient un enjeu stratégique que la CNIL française encourage dans ses recommandations sur la protection des données.
Des solutions techniques qui changent la donne
La QuietBox 2 de Tenstorrent, présentée par IEEE Spectrum (États-Unis), illustre cette nouvelle génération de machines. Avec 384 Go de mémoire totale et quatre accélérateurs IA dédiés, elle peut faire tourner des modèles comme Llama 3.1 70B à près de 500 tokens par seconde, soit plusieurs fois plus vite qu'une réponse classique de GPT ou Claude.
Le point crucial : cette machine consomme 1 400 watts maximum, restant compatible avec une prise électrique standard de bureau. Comme l'explique Milos Trajkovic, cofondateur de Tenstorrent, dans IEEE Spectrum (États-Unis) : "Nos 128 gigaoctets de GDDR6 nécessiteraient quatre cartes graphiques Nvidia RTX 5090. Cela ne rentrerait pas dans un format de 1 600 watts, et le coût de quatre RTX 5090 serait énorme."
Implications stratégiques pour les PME françaises
Ces développements ouvrent des perspectives concrètes. Une ETI française pourrait ainsi déployer des modèles d'IA performants sans externaliser ses données sensibles, répondant aux exigences de l'AI Act européen sur la transparence et le contrôle des systèmes d'IA à haut risque.
Les secteurs particulièrement concernés incluent la finance (analyse de risques), l'industrie (maintenance prédictive) et les services professionnels (analyse documentaire). Bpifrance pourrait d'ailleurs intégrer ce type d'investissements technologiques dans ses dispositifs de soutien à la digitalisation des PME.
Recommandations pour les dirigeants
Face à cette évolution, trois actions concrètes s'imposent. D'abord, évaluer précisément vos besoins en IA : quels modèles, quelle fréquence d'usage, quels volumes de données ? Ensuite, comparer les coûts totaux entre solutions cloud et infrastructure locale sur 3-5 ans, en intégrant la sécurité des données. Enfin, anticiper la formation technique de vos équipes, potentiellement via votre OPCO qui finance désormais des parcours IA spécialisés.
L'arrivée prévue de ces workstations au deuxième trimestre 2026, avec un prix attendu de 10 000 dollars selon IEEE Spectrum (États-Unis), place l'IA haute performance à portée des budgets d'investissement classiques des PME. Une opportunité à saisir pour renforcer l'autonomie technologique française.
Sources : IEEE Spectrum (États-Unis).