Aller au contenu
En production Phare

LeCompute

Média francophone de l'infrastructure IA : analyses techniques et benchmarks compute, du silicium aux runtimes d'inférence. En production.

Live lecompute.fr
Astro MDX · statique
Open datasets de benchmarks
DU SILICIUM AUX RUNTIMES · DÉBIT D'INFÉRENCE tokens / seconde ● live · lecompute.fr 0 1k 2k 3k 4k vLLM GPU 3 800 TGI GPU 2 600 llama.cpp GPU 1 450 llama.cpp CPU 320
Média francophone de l'infrastructure IA : chaque affirmation s'appuie sur des chiffres et des datasets ouverts et reproductibles, du silicium aux runtimes d'inférence. Débits donnés à titre illustratif. En production sur lecompute.fr.

Le constat

Le compute est devenu le nerf de l’IA, mais la couverture francophone sérieuse manque : beaucoup de hype, peu de mesures. Les chiffres qui comptent (débit, coût par million de tokens, latence, consommation) sont rarement posés à plat, et encore plus rarement reproductibles.

La ligne éditoriale

LeCompute est un média de l’infrastructure IA : des analyses techniques et des benchmarks compute, du silicium aux runtimes d’inférence. Le parti pris est simple. Chaque affirmation s’appuie sur des chiffres, et ces chiffres reposent sur des datasets ouverts et reproductibles. Un benchmark que l’on ne peut pas rejouer n’est qu’une opinion.

La fabrique

Le site est construit en Astro et MDX, 100 % statique. Pour un média technique, ce choix est cohérent : un rendu rapide, un bon référencement, et la possibilité de mêler prose, chiffres et composants dans un même article. La performance et la maintenabilité font partie du propos autant que le contenu.

État

En production sur lecompute.fr, en publication continue.