Meta a annoncé la prochaine version de son système d’IA pour décoder de manière non invasive l’activité cérébrale en texte. Appelée Brain2Qwerty v2, la société espère que sa dernière méthode aidera les personnes souffrant de lésions neurologiques ou de maladies altérant la parole.
La dernière interface cerveau-ordinateur (BCI) de Meta s’appuie sur Brain2Qwerty v1 de l’année dernière, qui montrait initialement que les enregistrements cérébraux non invasifs pouvaient être décodés en texte avec une précision étonnamment élevée au niveau des caractères. Il utilisait à la fois l’électroencéphalographie (EEG) et la magnétoencéphalographie (MEG) – deux méthodes non invasives qui mesurent les champs magnétiques et électriques provoqués par l’activité neuronale – même s’il n’était capable de décoder que des caractères individuels.
Aujourd’hui, la société a présenté son modèle v2, qui améliorerait presque tous les aspects du système en utilisant une architecture de bout en bout, des modèles de langage étendus (LLM), un décodage en temps réel et une reconnaissance de formes considérablement améliorée.
Note: Les résultats ont été présentés dans un article récent auquel ont participé des chercheurs de Meta et de nombreuses universités et instituts, dont l’Université PSL (y compris l’École Normale Supérieure), l’Université de Lille, l’Université Paris Cité, l’Université Paris-Saclay, le CNRS, Inria, le CEA (NeuroSpin), le Centre Basque sur la Cognition, le Cerveau et le Langage (BCBL) et la Fondation Hospitalière Adolphe de Rothschild.
Selon le journal, Brain2Qwerty v2 a été formé sur environ 22 000 phrases de neuf participants volontaires, chacune d’entre elles ayant été enregistrée pendant 10 heures en portant un appareil MEG tout en tapant activement.
Meta dit qu’au lieu de s’appuyer sur des pipelines fabriqués à la main pour détecter les événements neuronaux, ils ont utilisé l’apprentissage profond de bout en bout pour décoder directement à partir des signaux cérébraux bruts, ce qui signifie essentiellement qu’ils pouvaient non seulement décoder des lettres simples comme dans la version 1, mais également des mots et des phrases complètes.
Bien que la v2 représente un pas en avant assez significatif, elle n’a pas encore atteint une précision de 100 % :
« Brain2Qwerty v2 récupère les phrases de manière cohérente à partir d’entrées neuronales bruyantes, atteignant un taux de précision des mots de 61 %, améliorant considérablement la précision des mots de 8 % obtenue par d’autres méthodes non invasives », explique Meta.
Meta affirme que son participant le plus performant a atteint une précision des mots de 78 %, où « plus de la moitié de toutes les phrases sont décodées avec une erreur d’un mot ou moins », indique la société.
« Nous constatons également que la précision du décodage s’améliore de manière log-linéaire avec le volume de données, ce qui suggère que l’écart de performance restant avec les approches chirurgicales pourrait être encore réduit grâce à la seule mise à l’échelle des données. »
L’objectif à long terme du projet est de développer des technologies de communication pour les personnes souffrant de lésions neurologiques ou de maladies altérant la parole, notamment sans nécessiter de chirurgie invasive, comme la startup Neuralink BCI d’Elon Musk, qui a étendu les essais cliniques sur l’homme plus tôt cette année.
Les chercheurs soulignent dans Nature que si les méthodes invasives sont plus efficaces pour traduire la pensée en texte, elles exposent les patients à « des risques non négligeables d’hémorragie cérébrale et d’infection ». Les défis très réels liés au maintien de la fonction des implants corticaux sur des périodes prolongées constituent également un risque, ce qui rend les méthodes invasives globalement moins évolutives.
Cela dit, il reste encore un long chemin à parcourir avant de voir quoi que ce soit se rapprocher des appareils MEG grand public. De nombreux appareils MEG classiques d’aujourd’hui sont encore très massifs, bien qu’il existe maintenant des appareils plus petits qui peuvent fonctionner à température ambiante, comme les magnétomètres à pompage optique (OPM) de Cerca.
Le principal limiteur qui retient MEG en vue d’une éventuelle adoption par le consommateur est l’interférence magnétique de fond, qui nécessite que même ces systèmes beaucoup plus petits fonctionnent dans un environnement protégé magnétiquement ; les champs magnétiques générés par le cerveau sont beaucoup plus faibles que le champ magnétique terrestre et que la multitude de technologies quotidiennes comme les smartphones, le Wi-Fi et les lignes électriques qui sont toutes des millions des fois plus fort.
Quoi qu’il en soit, il est réconfortant de voir que les patients qui ne peut pas se qualifier pour une BCI invasive pourrait un jour, espérons-le bientôt, améliorer considérablement sa qualité de vie.