Des chercheurs américains ont dévoilé des lunettes connectées expérimentales capables de lire sur les lèvres de leur porteur. Celles-ci pourraient notamment être utilisées pour contrôler des appareils électroniques.
EchoSpeech
La face intérieure de la monture des lunettes EchoSpeech intègre deux haut-parleurs miniatures émettant des ondes sonores inaudibles en direction de la bouche de l’utilisateur lorsqu’il prononce des mots. Réfléchies par ses mouvement buccaux, elles sont captées par deux autres dispositifs (situés sur la face extérieure) et analysées en temps réel par une IA (dans ce cas un algorithme d’apprentissage profond).
Selon ses concepteurs, le dispositif présente plusieurs avantages notables par rapport aux technologies expérimentales concurrentes.
N’impliquant pas de flux vidéo (qui se révèlent nettement plus volumineux), celui-ci possède une autonomie de 10 heures, quand celle des lunettes équipées de caméras excède rarement 30 minutes. La quantité relativement faible de données transmises implique également que l’ensemble de leur traitement puisse être effectué via une application smartphone dédiée.
« Pour les personnes qui ne peuvent pas vocaliser, EchoSpeech pourrait constituer un excellent périphérique d’entrée pour la synthèse vocale », estime Ruidong Zhang, qui supervise son développement.
Un dispositif capable d’identifier 31 commandes silencieuses avec une précision de 95 %
EchoSpeech est actuellement capable d’identifier 31 commandes silencieuses avec une précision de 95 % et ne nécessite que quelques minutes pour être paramétré. L’équipe de l’université Cornell a indiqué travailler à sa commercialisation.
Les chercheurs du SciFi Lab avaient précédemment dévoilé EarIO, dispositif auditif équipé d’un sonar capable de capturer les expressions faciales du porteur, principalement utilisé pour créer des avatars numériques.
Reposant sur une approche similaire, le système EarCommand de l’université de Buffalo est de son côté capable de détecter les mots prononcés silencieusement grâce à un instrument enregistrant en temps réel les déformations distinctes du canal auditif produites par des mouvements buccaux spécifiques.