Fluence · Killian Pluenet

Le problème

La sclérose latérale amyotrophique (SLA) prive progressivement de la parole et du mouvement, sans toucher à la pensée. Communiquer devient une course contre la perte motrice, avec des outils souvent lents, fermés et dépendants du cloud. Pour un dispositif aussi intime et vital, cette dépendance est un défaut de conception : une coupure réseau ne devrait jamais couper la parole, et la communication la plus personnelle qui soit n’a pas à transiter par les serveurs d’un tiers.

S’adapter à ce que la personne contrôle encore

La capacité motrice varie d’une personne à l’autre et se dégrade avec le temps. L’entrée est donc multimodale : le regard (oculométrie), les mouvements de tête, ou un simple contacteur quand il ne reste qu’un geste fiable. Le système s’ajuste à ce que la personne peut encore commander, au lieu d’imposer une modalité unique.

Accélérer la communication

Épeler lettre à lettre au regard est lent et épuisant. Fluence accélère la saisie avec un modèle de langage qui prédit mots et tournures à partir du contexte, exécuté localement. L’objectif n’est pas cosmétique : viser un facteur 3 sur les mots par minute effectifs change concrètement la capacité à tenir une conversation.

Garder sa voix

Parler à travers une voix de synthèse générique, c’est perdre une part de soi. Fluence restitue la voix personnelle de l’utilisateur, clonée à partir d’enregistrements, pour qu’il continue de s’exprimer avec sa propre voix.

Local par principe

Tout tourne sur l’appareil, sans connexion. Ce choix répond à trois exigences : la confidentialité (rien de plus privé que ses propres mots), la latence (un aller-retour vers le cloud est incompatible avec une conversation), et la disponibilité (l’outil doit fonctionner partout, tout le temps). La contrainte technique qui en découle, et le cœur du travail actuel, c’est la latence d’inférence locale.

Architecture

Le projet est un monorepo organisé autour d’un protocole qui sert de source de vérité : les schémas de messages y sont définis une fois, et tout le reste s’y conforme. Le cœur (hub, protocole, inférence, entrée, voix, stockage) est en Rust ; le SDK et l’interface en TypeScript, dans une application desktop Tauri ; le pipeline de données, d’entraînement et d’évaluation en Python. L’ingénierie est tenue au sérieux : intégration continue sur Windows et Linux, décisions d’architecture numérotées (ADR), pyramide de tests.

État

Pré-alpha, en développement actif. L’architecture (protocole, inférence, voix) est en place ; le travail porte sur la latence d’inférence locale et la qualité de l’entrée multimodale. Code open-source.