L'IA et les réseaux neuronaux profonds dans les appareils auditifs
Tout ce que vous devez savoir (mais que vous n'osiez peut-être pas demander)
Avez-vous l'impression que le monde a été submergé par des expressions telles que « intelligence artificielle », « modèles d'apprentissage du langage », « réseaux neuronaux profonds », « apprentissage automatique » et autres ? Vous n'avez pas tort !
Bien que la plupart de ces technologies existent depuis des années, les récents lancements d'outils d'IA capables de tout faire, de la rédaction d'un essai au dépistage du cancer à partir d'IRM, ont captivé les médias, les gouvernements, les entreprises et le grand public quant à leurs possibilités (tout en suscitant une certaine inquiétude face à la rapidité de ces changements).
Ce type de technologie peut devenir extrêmement sophistiqué, mais une fois que vous maîtriserez les définitions et les concepts de base, vous serez en mesure de discuter de ces sujets en toute confiance et de les expliquer à vos patients en termes simples.
Qu'est-ce qu'un DNN ?
(Et la taille a-t-elle vraiment de l'importance ?)
Les réseaux neuronaux profonds : introduction
Un réseau neuronal profond, ou DNN, est un type de réseau neuronal artificiel (RNA). À l'instar des neurones individuels du cerveau humain, les nœuds d'un RNA collaborent pour apprendre et résoudre des problèmes à partir des données qui leur sont fournies.
Un DNN comporte une ou plusieurs couches de nœuds cachés entre les couches d'entrée et de sortie, ce qui signifie qu'avec un entraînement adapté, il est plus à même d'apprendre à reconnaître des modèles et à résoudre des problèmes complexes, comme nous le faisons chaque jour avec notre cerveau.
Un DNN apprend grâce à l'entraînement sur des données d'entrée et à l'apprentissage automatique, processus par lequel un réseau neuronal se programme (ou s'enseigne) lui-même. Les DNN peuvent être entraînés sur tous les types de données, y compris les images, le texte, les vidéos, le son et bien d’autres encore.
Pour entraîner un DNN, on présente à l’algorithme de nombreuses paires d’entrées et de sorties étiquetées. L’algorithme doit alors « apprendre » par lui-même quelles règles peuvent être utilisées pour aboutir à la sortie correcte pour une entrée donnée, grâce à des tentatives répétées et à un retour d’information continu sur ces tentatives.
En disposant d’un vaste ensemble de données présentant une grande variabilité, le DNN finira par être capable de généraliser — en d’autres termes, de traiter avec précision des données qu’il n’a jamais vues lors de l’entraînement.
Par exemple, si l'ensemble de données comprend 10 photos de chevaux, le réseau neuronal profond (DNN) pourrait identifier correctement une nouvelle photo de cheval dans 5 % des cas. Dans les 95 % restants, il pourrait croire qu'il s'agit d'un chien ou d'une table. Si l'ensemble de données d'apprentissage contient 10 000 photos de chevaux, le DNN sera alors capable d'identifier une nouvelle photo de cheval dans près de 100 % des cas.
Ainsi, tout comme le cerveau humain, plus le DNN a été entraîné sur un grand nombre d'informations, mieux il est capable de reconnaître des modèles et de prendre des décisions.
Vous suivez toujours ? Ce n'est pas trop compliqué, n'est-ce pas ? Voilà pour les bases. Passons maintenant aux choses amusantes.
Pourquoi la taille du DNN est-elle importante ?
Oui, plus c'est grand, mieux c'est.
Vous vous souvenez quand nous avons appris qu'un réseau neuronal profond (DNN) comporte trois types de couches de nœuds : la couche d'entrée, la couche de sortie et la ou les couches cachées situées entre les deux ? C'est dans ces couches cachées que la magie opère. En général, plus il y a de couches et de nœuds par couche, plus le DNN est capable d'effectuer de calculs ou de « raisonnements » entre les couches d'entrée et de sortie. Cela signifie que le DNN peut traiter des tâches de plus en plus complexes.
La manière spécifique dont les couches cachées d’un DNN sont structurées et connectées entre elles joue également un rôle crucial dans son fonctionnement. C’est pourquoi les structures des DNN peuvent être optimisées pour accomplir certaines tâches mieux que d’autres.
On pourrait comparer cela au cerveau des animaux : plus le cerveau est grand et plus les neurones sont densément répartis, plus la créature est « intelligente ». Un petit DNN à une seule couche pourrait s’apparenter au cerveau d’une petite grenouille, tandis qu’un grand DNN à plusieurs couches ressemblerait davantage au cerveau humain.
Lequel est le mieux équipé pour comprendre l’intention d’un interlocuteur : la grenouille ou l’humain ? La réflexion de haut niveau et la résolution de problèmes dans un DNN sont en grande partie le résultat mathématique d’un plus grand nombre de nœuds effectuant davantage de calculs pour obtenir de meilleurs résultats.
De plus, nous pouvons entraîner des DNN plus grands sur des ensembles de données plus volumineux ; ils peuvent ainsi accéder à de plus grandes quantités d’informations pour prendre de meilleures décisions. La grenouille mentionnée plus haut ne sera pas aussi douée pour apprendre l’alphabet que l’un d’entre nous, dotés d’un cerveau humain.
Un grand réseau neuronal profond doté d'une architecture optimale sera capable d'exploiter beaucoup plus de données pour ses calculs qu'un petit réseau neuronal profond aux capacités limitées.
L'IA dans les appareils auditifs
Il existe actuellement trois façons dont les appareils auditifs utilisent les réseaux neuronaux profonds (DNN).
La première, et la plus courante, consiste à classer l'environnement sonore. Le fabricant entraîne le classificateur d'environnements sonores à l'aide de différents sons afin d'apprendre à l'appareil auditif quand activer ou désactiver certaines fonctions.
Pour reprendre l'exemple ci-dessus, cela revient à apprendre à l'aide auditive à distinguer un cheval d'une table ; ou, pour prendre un exemple plus pertinent dans le domaine des aides auditives, à lui apprendre à faire la différence entre la parole dans le bruit et le bruit pur.
Une autre façon dont les aides auditives peuvent utiliser les DNN consiste à réduire légèrement le bruit. Cela ne diffère pas beaucoup de la technologie traditionnelle de réduction du bruit. Elles indiquent à l'aide auditive quels sons constituent un bruit indésirable et tentent de le réduire en diminuant sélectivement le gain.
La troisième façon, et la plus unique, dont les aides auditives utilisent un DNN consiste à séparer instantanément la parole du bruit. Ce type de DNN libère l'aide auditive de l'utilisation d'une directivité étroite et permet à l'auditeur d'entendre plusieurs locuteurs provenant de n'importe quelle direction. Cela est réalisé en identifiant et en isolant la parole afin qu'elle puisse être préservée et renforcée.
Tous les réseaux neuronaux profonds (DNN) ne se valent pas
Les petits réseaux neuronaux profonds, utilisés principalement pour classer les environnements sonores, doivent fonctionner en permanence, car c’est ainsi qu’ils déterminent les programmes et les fonctionnalités à activer lorsque l’environnement de l’utilisateur change.
Le grand DNN à structure unique d'Infinio Ultra Sphere est activé selon les besoins pour effectuer un nettoyage sonore en temps réel, par exemple lorsque l'utilisateur entre dans un environnement bruyant (comme un restaurant bondé).
D'autres marques utilisent également leurs petits DNN pour faciliter la gestion du bruit, mais les avantages pour les patients sont assez limités en raison du nombre restreint de nœuds chargés de la « réflexion ».
Comment l'IA et les réseaux neuronaux profonds (DNN) améliorent-ils l'audition dans la vie quotidienne ?
L'IA dans les aides auditives n'est pas une fonctionnalité que l'on peut mesurer directement, mais on peut examiner comment les fonctionnalités basées sur l'IA apportent des avantages aux patients. N'importe qui peut affirmer disposer d'une IA et l'utiliser dans ses aides auditives, mais la véritable question à se poser est la suivante : quels avantages cela apporte-t-il au professionnel de santé et au patient ?
La réponse peut varier considérablement d'une marque à l'autre.
Comment certaines marques utilisent l'IA
- Classification des scènes sonores/orientation des fonctionnalités
Certains fabricants utilisent de petits réseaux neuronaux profonds (DNN) pour classer l'environnement d'écoute ou détecter la présence de la parole. Cela signifie que le DNN doit être « activé » en permanence, car la tâche qu'il effectue doit être réalisée en continu. Les DNN sont un outil permettant d'accomplir cette tâche, mais ils ne sont pas nécessairement meilleurs que d'autres approches.
- Réduction de bruit traditionnelle
Une autre façon dont certaines marques utilisent les DNN dans les aides auditives consiste à piloter la réduction numérique du bruit. Dans cette application, le DNN aide l’aide auditive à appliquer une réduction de gain spécifique à chaque canal afin de rendre l’écoute plus confortable, mais cette approche ne permet pas d’isoler efficacement la parole du bruit.
Comment Phonak utilise l'IA
Classification des scènes sonores / adaptation des paramètres
AutoSense OS utilise l'IA et l'apprentissage automatique pour capturer et analyser avec précision l'environnement sonore, puis combine de manière précise les paramètres de plusieurs programmes en temps réel afin d'offrir une expérience d'écoute fluide. AutoSense OS est toujours actif et à l'écoute des changements dans l'environnement afin d'optimiser automatiquement la sortie sonore pour l'utilisateur.
Les aides auditives Phonak ont commencé à utiliser AutoSense OS en 2016, et cette technologie n’a cessé d’être développée et perfectionnée au fil des ans. AutoSense 6.0 a été commercialisé avec la plateforme Infinio en août 2024 et exploite la puissante puce ERA pour analyser l’environnement de l’utilisateur 700 fois par seconde afin d’effectuer des réglages auditifs automatiques.
La dernière génération d’AutoSense OS est intégrée aux appareils Infinio Ultra, notamment aux premières aides auditives sur mesure rechargeables de Phonak, les Virto R Infinio. AutoSense OS 7.0 exploite la puissance de l’intelligence artificielle pour identifier avec précision la situation d’écoute de votre patient et s’y adapter, et a été entraîné avec 18 fois plus d’environnements d’écoute réels. Il reconnaît également différents genres musicaux avec une précision exceptionnelle afin d’améliorer l’expérience d’écoute des mélomanes.
- Séparation instantanée de la parole et du bruit dans toutes les directions
La technologie Spheric Speech Clarity (SSC) 2.0 de Phonak est rendue possible par la puce IA DEEPSONIC™, qui utilise un réseau neuronal profond (DNN) de grande envergure et hautement entraîné pour séparer et éliminer le bruit de fond de la parole, offrant ainsi une expérience d'écoute qui ne manquera pas d'impressionner les utilisateurs. C'est ainsi que l'Infinio Ultra Sphere gère le bruit d'une manière unique et révolutionnaire.
Spheric Speech Clarity 2.0 utilise un système de débruitage basé sur un réseau neuronal profond (DNN) pour extraire, améliorer et intégrer la parole provenant de n'importe quelle direction. Cela permet aux patients d'entendre ce qui compte le plus, même dans des environnements acoustiques complexes, pour des conversations plus claires dans les lieux bruyants. Aucune autre technologie d'aide auditive n'est capable d'un tel exploit.
Pour comprendre à quelle vitesse DEEPSONIC effectue des calculs et traite les données, sachez qu’il peut réaliser 7,7 milliards d’opérations par seconde.
Cette technologie puissante représente un bond en avant dans le domaine des solutions auditives, plaçant Infinio Ultra Sphere avec Spheric Speech Clarity 2.0 dans une catégorie entièrement nouvelle de solutions auditives, bien au-delà de tout ce qui existe actuellement sur le marché.
Désormais 30 % plus efficace, il offre un nouveau niveau de clarté de la parole tout au long de la journée.
Idées reçues courantes
Avez-vous déjà entendu parler de tout ça ?
Écoutez, il y aura toujours quelqu’un pour donner son avis. Mais tout comme Infinio, nous ferons de notre mieux pour faire le tri entre le bruit de fond et ce que vous voulez vraiment entendre.
Faux. Phonak innove dans le domaine de l'IA depuis plus de 25 ans et a lancé sa première solution Phonak basée sur l'IA dès 1999 ! Le système d'exploitation Autosense a été lancé en 2016. La nouveauté réside dans la façon dont Infinio Ultra Sphere utilise une puce de traitement DNN dédiée pour offrir un niveau de clarté et de netteté de la parole bien supérieur à celui de toute autre technologie auditive existante.
Le secteur utilise des puces hybrides depuis des années. Mais la puce DEEPSONIC™ de l’Infinio Ultra Sphere présente une architecture totalement différente de celle des puces des aides auditives précédentes. Développée en exclusivité par Sonova pour améliorer la compréhension de la parole dans le bruit bien au-delà de toute autre technologie existante, cette puce IA dédiée intègre un réseau neuronal profond (DNN) qui offre une réduction du bruit d’un niveau supérieur. Il n’existe aucune puce comparable dans aucun secteur.
Non. L'Infinio Ultra Sphere est la seule aide auditive du secteur à utiliser une puce IA dédiée pour séparer la parole du bruit. Le DNN de la puce DEEPSONIC™ dispose d'une architecture optimale pour l'amélioration de la parole et a été entraîné sur plus de 22 millions d'échantillons sonores, ce qui permet à l'IA d'identifier et de réduire correctement le bruit de fond.
Faux. Bien qu'une puce DNN dédiée consomme davantage d'énergie que celles intégrant un petit DNN dans leur puce de traitement, ces appareils offrent une autonomie d'une journée complète pour le patient. En fait, nos données montrent qu'en moyenne, les utilisateurs de Sphere utilisent leurs aides auditives encore plus longtemps chaque jour que les personnes portant notre plateforme précédente. Et soyons clairs : les avantages d'une technologie puissante basée sur l'IA, rendue possible par une puce DNN dédiée, ne sont tout simplement pas envisageables avec aucune autre technologie d'aide auditive existante.
Non. Les aides auditives utilisent les réseaux neuronaux profonds (DNN) pour différentes raisons. Lorsqu’il sert à identifier la situation d’écoute, le DNN doit rester activé en permanence. Les appareils Phonak utilisent AutoSenseOS™, une technologie basée sur l'apprentissage automatique, pour identifier l'environnement sonore et s'y adapter automatiquement. Avec Sphere, la puce IA dédiée utilise un grand réseau neuronal profond (DNN) pour séparer instantanément la parole du bruit. Cette fonction n'est active qu'en présence de bruit de fond. Vous ne voudriez pas que toutes les lumières de votre maison soient en permanence en mode tamisé si vous utilisiez une pièce nécessitant une lumière vive, n'est-ce pas ?
Faux. Ce ne serait pas une expérience très agréable pour le patient, n’est-ce pas ? Vous et votre patient pouvez contrôler la durée pendant laquelle Spheric Speech Clarity 2.0 peut rester actif sur une seule charge. Avec les réglages par défaut, la batterie offre suffisamment d’autonomie pour une journée complète d’écoute polyvalente pour votre patient.
Non. Toutes les indications d’autonomie ne se réfèrent pas à la même chose, et certaines marques mesurent l’autonomie de manière très différente. Les aides auditives Infinio Ultra Sphere offrent jusqu’à 56 heures d’écoute exceptionnelle sur une seule charge. C’est une performance durable sur laquelle vos patients peuvent compter.
Totalement faux. L'IA adaptative est intégrée à toutes les aides auditives Phonak Infinio Ultra. AutoSense OS™ utilise l'IA en temps réel pour analyser en continu l'environnement et effectuer intelligemment des réglages d'écoute automatiques avec une précision incroyable, afin d'offrir un son naturel et équilibré. À tout moment. Partout.
Ce n'est pas vrai. Cela ne serait pas très pratique. Les aides auditives de pointe, dotées d'une intelligence artificielle, donnent vie à la parole, à la musique et à tout ce qui se trouve entre les deux. Et AutoSense OS™ va encore plus loin ! Il identifie avec précision la situation d'écoute et s'adapte instantanément, qu'il s'agisse d'une playlist ou d'un concert en direct. Et grâce à une connectivité universelle à la pointe du marché, les utilisateurs peuvent véritablement tout entendre directement dans leurs oreilles.
Ressources supplémentaires
Pour consulter d'autres ressources, utilisez les flèches ou la barre grise pour faire défiler vers la droite ou vers la gauche.