Comprendre et interpréter les mesures faites par Que Choisir

Le magazine Que Choisir vient de publier une nouvelle enquête, un comparatif entre des aides auditives de classe I et d'autres de classe II. Voici quelques billes pour comprendre les outils qui ont été utilisés pour réaliser ces tests et plus généralement pour interpréter les indices d'intelligibilité et de qualité.

Par Xavier Delerce
kemar

En 2019, le magazine Que Choisir publiait un comparatif de performances d’aides auditives qui à l’époque, avait eu un retentissement important. 

Bien que ces techniques de mesures soient aujourd’hui utilisées en routine par de nombreuses équipes de recherches en audiologie, le monde de l’audioprothèse en France découvrait qu’il était possible de comparer les aides auditives entre elles, sur le plan de la performance et de la qualité sonore. Qu’un intervenant externe à la profession se charge de ces analyses piquait la profession au vif, mais il faut bien reconnaître que nous n’avions aucune base de référence, ni pour vérifier la véracité de ces tests, ni pour juger de leur efficience ou de la robustesse des protocoles mis en place. 

À la décharge des audioprothésistes, l’analyse comparative de produits de santé dont les performances sont tellement « opérateur dépendant » (dépendantes des réglages effectués par le professionnel), ne pouvait que provoquer une levée de boucliers : que représentaient ces notes sur 20 ? Ces carrés (« médiocre ») ? Ces étoiles ? Quel était le protocole de test ? Était-il reproductible ? Quels étaient les tests réalisés ? Étaient-ils scientifiquement validés et reconnus ? Comment les appareils étaient-ils réglés ? etc. 

Toutes ces questions étaient légitimes et on peut regretter une certaine recherche de sensationnalisme qui avait empêché, à l’époque, une collaboration entre ce magazine et des équipes des recherches et formation universitaires et indépendantes (et françaises). Nous aurions tous eu à y gagner : les audioprothésistes par une meilleure connaissance des produits de santé qu’ils proposaient, les patients/consommateurs par une meilleure information et la communauté scientifique, par une plus grande indépendance vis-à-vis des discours et des écrits de fabricants d’aides auditives, forcément partiaux. 

À toute chose malheur est bon, et cet article de 2019 fut l’occasion pour nombre de nos confrères de découvrir l’existence des indices objectifs et qualité et d’intelligibilité des aides auditives, sujet abordé en détail lors du dernier EPU de 2021. 

Les reproches faits à Que Choisir à l’époque du premier comparatif, portaient essentiellement sur la démarche scientifique et l’aspect unilatéral des mesures (pas de concertation avec le CNA sur la pertinence des indices utilisés par exemple). Aucun protocole de test n’avait été rendu public, aucun indice n’était cité et surtout, chose pourtant essentielle en matière scientifique, les mesures n’étaient pas reproductibles par d’autres équipes de recherche. Les résultats restaient locaux, donc. 

Que Choisir réédite ces mesures en janvier 2022, mais a laissé « fuiter » son protocole de tests avant publication, certainement de manière intentionnelle. L’occasion pour nous de nous intéresser à ces mesures en particulier, mais également aux mesures objectives en général afin de bien appréhender cet aspect technique de l’audiologie prothétique. 

Quelles sont les mesures objectives d’intelligibilité et de qualité ? Que représentent-elles ? Comment les lire et les interpréter ? Un indice est-il suffisant pour décrire une sensation de confort ou d’inconfort dans le bruit ? 

Partons donc dans le monde magique de la prédiction à travers une petite revue scientifique ! 

Qu’est-ce qu’un indice de prédiction objectif ? 

Un indice de prédiction objectif, comme son nom l’indique, a pour but de calculer, en s’affranchissant des performances individuelles d’un patient ou d’un sujet, la qualité sonore ou l’intelligibilité ou la perception vocale (selon les indices) avec une aide auditive. 

L’indice le plus connu dans le monde de l’audiologie est le SII (Speech Intelligibility Index) (Pavlovic, 1987). Toutes nos chaînes de mesures affichent le SII après une mesure in vivo, par calcul des informations de crêtes au-dessus du seuil du patient, et en fonction de l’importance de telle ou telle bande de 1/3 d’octave dans l’intelligibilité. 

Une telle mesure objective est dite « non-intrusive », c’est-à-dire que le signal dont on mesure l’émergence (la parole en l’occurrence) est le seul émis et mesuré, aucun autre bruit concurrent n’étant émis pendant la mesure. 

Tests non-intrusifs et tests intrusifs 

La mesure du SII telle qu’elle est effectuée en audioprothèse est forcément réductrice, puisque seules les conditions d’écoute sans bruit(s) peuvent être explorées. 

Afin de tester l’émergence vocale ou la qualité dans le bruit, des indices objectifs dits « intrusifs » ont vu progressivement le jour ces dernières années. 

Leur principe consiste à rechercher un signal « propre » au milieu d’un mélange signal + bruit à la sortie et/ou à l’entrée de l’aide auditive. Cette recherche du signal cible (la parole le plus souvent) se fait en recherchant sa structure fine, son enveloppe ou les deux, dans le mélange signal + bruit : 

XD 1

L’analyse intrusive n’est pas nouvelle dans le domaine de l’analyse des transmissions, mais est utilisée de façon plus récente mais de plus en plus massivement dans le domaine de l’audiologie prothétique (Hines, 2012). 

La plus ou moins grande émergence de l’enveloppe ou de la structure fine du signal au milieu du bruit va déterminer, par calcul, l’émergence de la parole. Cette émergence est ensuite retranscrite sous la forme d’un indice d’intelligibilité ou de perception. 

De même, les altérations de l’enveloppe ou de la structure fine du signal cible par le bruit ou par l’aide auditive sont retranscrites sous la forme d’un indice de qualité du signal. 

Modèles mathématiques de l’audition 

Un modèle auditif est également associé à l’analyse de l’enveloppe et de la structure fine. Il consiste à simuler le fonctionnement normal ou pathologique de l’oreille (J. Kates, 2013). 

Ces modèles mathématiques simulent de façon plus ou moins complète l’oreille externe (HRTF/REUG), moyenne et interne (fonction compressive des CCI, amplificatrice des CCE, élargissement des bandes critiques, masquage, etc) et certaines fonctions psychoacoustiques. Certains modèles actuels sont d’une exhaustivité importante. 

Prédiction d’intelligibilité, de qualité ou de musicalité 

Ces indices recouvrent donc plusieurs critères : perception vocale ou intelligibilité, qualité du signal vocal transmis mais également la qualité de restitution de la musique pour certains, lorsque le signal cible est un signal musical. 

Il existe à ce jour plusieurs dizaines d’indices objectifs. L’analyse de leur qualité de prédiction, c’est-à-dire la force de la corrélation entre leur prédiction et l’intelligibilité réelle de sujets testés fait ressortir du lot quelques indices seulement (van Kuyk et al., 2018). 

Quelques indices de qualité sonore 

La qualité sonore d’une aide auditive est sa capacité à préserver l’intégrité de l’enveloppe de la parole amplifiée par rapport à la parole d’origine, tout en dégradant au maximum celle du bruit. On se rend compte à l’énoncé du problème de sa complexité. 

Les quelques indices suivants sont parmi les plus fréquemment utilisés (sauf pour le premier cité) et semblent faire consensus dans la littérature. 

Indice de différences d’enveloppes (EDI) 

La déformation de l’enveloppe temporelle du signal par la compression a été très tôt mesurée en audiologie prothétique (Fortune et al., 1994), et cette technique a été améliorée au fil des années (Hoover et al., 2012). 

L’indice de déformation d’enveloppe temporelle (EDI : Envelope Difference Index), quel que soit son calcul, est un indice variant de 0 (aucune déformation d’enveloppe) à 1 (enveloppe totalement déformée). Il est possible de quantifier séparément la déformation du signal (que l’on espère minimale) et celle du bruit (que l’on espère maximale) : 

XD2

Perception de la qualité vocale (PESQ) 

L’indice PESQ (Perceptual Evaluation of Speech Quality) n’avait pas été élaboré à l’origine pour évaluer les aides auditives, mais afin d’évaluer la qualité vocale lors des transmissions (téléphonie, audio-visuel, transmission, etc.). Cet indice robuste apparaît cependant fréquemment dans l’analyse des algorithmes des aides auditive (Goetze et al., 2014). 

Cet indice varie de -0,5 (mauvaise qualité de la parole) à 4,5 (transmission excellente) : 

XD3

L’indice de qualité de la parole pour les aides auditives 

L’indice HASQI (Hearing Aids Speech Quality Index), dans sa version 2 de 2014 est considéré à ce jour comme un des indices de qualité les plus aboutis (J. M. Kates & Lundberg, 2021). Cet indice de qualité varie de 0 (signal d’origine totalement déformé) à 1 (totalement conforme à l’original) : 

XD4

On notera la très forte influence de la baisse d’audition dans les résultats de qualité. La surdité protège du bruit (elle protège également de l’intelligibilité !), et en cela, évite au malentendant non-appareillé certaines distorsions liées à l’interférence du bruit sur le signal. 

L’HASQI v2 est un indice de qualité qui est rarement bon dans le bruit. Dans le silence, tout comme l’EDI, l’HASQI v2 montre assez nettement l’effet de la compression sur la qualité du signal amplifié. 

Les différents indices de qualité tentent de concilier un aspect forcément subjectif (la qualité) et un calcul mathématique objectif. Si on peut le leur reprocher, ils ont le mérite de mettre en évidence les effets du traitement du signal et des divers algorithmes des aides auditives, notamment le plus basique d’entre eux : la compression. 

Quelques aides auditives récentes (de classe II), utilisent des algorithmes particuliers permettant la séparation des traitements du signal et du bruit afin de permettre une préservation maximale de l’enveloppe du signal (May et al., 2018). Ces traitements du signal peuvent donc être mis en évidence objectivement : 

XD5

Quelques indices de perception vocale 

Ces indices sont aujourd’hui les plus répandus dans la littérature scientifique et dans la communication de fabricants. Ce sont souvent les seuls à permettre une multitude de tests dans des conditions acoustiques très variées, relativement rapidement, et en s’affranchissant de la difficulté inhérente aux tests subjectifs. 

Ils reposent souvent sur des modèles auditifs très élaborés, et pour les plus récents d’entre eux, sur des réseaux de neurones (Pedersen et al., 2020), (J. M. Kates & Arehart, 2021) permettant de prédire la perception du signal dans le bruit. 

Plus encore que les indices de qualité, les indices d’intelligibilité (ou de perception de la parole, plus prudemment) sont très nombreux. 

On se focalisera sur les plus « performants » d’entre eux, c’est à dire ceux dont les scores de corrélation sont les meilleurs entre la prédiction (objective) et la réalité (subjective) (van Kuyk et al., 2018). 

Intelligibilité objective à court terme 

Deux indices (STOI : Short Term Objective Intelligibility, puis ESTOI : Extended Short Term Objective Intelligibillity) ont pour but de prédire l’intelligibilité « à court terme », c’est à dire par émergence rapide des crêtes du signal dans le bruit (STOI) puis plus récemment (Jensen & Taal, 2016) dans des bruits fluctuants (ESTOI). 

XD6

XD7

STOI et ESTOI varient de 0 (intelligibilité nulle) à 1 (intelligibilité parfaite). L’indice ESTOI est à ce jour le plus adapté à la simulation d’ambiances sonores réalistes, car fluctuantes. 

L’intelligibilité en bits 

La conversion de l’intelligibilité en bits/secondes (SIIB : Speech Intelligibility In Bits) est à ce jour un des indices les plus novateurs et les plus robustes dans la prédiction de perception vocale (van Kuyk et al., 2017). 

Basé sur la théorie de l’information, le SIIB apprécie la perception de la parole par son débit (en bits/secondes). Un débit de 150bits/sec est considéré idéal pour une perception de 100% du message : 

XD8

L’indice de perception de la parole avec aide auditive 

L’indice HASPI (Hearing Aid Speech Perception Index), dans sa version 2 la plus récente (J. M. Kates & Arehart, 2021), est un des indices les plus utilisés à l’heure actuelle pour l’évaluation objective des aides auditives. Son modèle mathématique auditif est considéré aujourd’hui comme l’un des plus évolués, et sa révision de 2021 adopte un réseau de neurones permettant une prédiction accrue de la perception de la parole dans le bruit. 

Il permet, comme les indices cités plus haut, la mesure d’aides auditives dans des environnements réalistes et très variés, mais également l’effet de couplages acoustiques variés tout en maintenant actifs les algorithmes (l’anti-larsen notamment) : 

XD10

Quels indices ont été utilisés par Que Choisir 

En 2019 et en 2021, les indices de qualité HASPI (version 1 de 2014) et d’intelligibilité HASQI ont été utilisés dans les catégories « Perception de la parole » et « Qualité de la parole ». 

Comme il y a deux ans, la « qualité » est « médiocre » dans le bruit, ce qui est, on l’a vu, inhérent à l’indice HASQI lui-même : la moindre présence de bruit altère l’enveloppe du signal. Il est en effet plus intéressant de comparer les aides auditives dans le silence lorsque l’on s’intéresse à la qualité sonore, la compression, très différente d’un modèle (classe I/classe II) et d’un fabricant à l’autre ayant des répercussions très différentes dans la préservation de l’intégrité du signal d’origine. 

L’intelligibilité est testée avec une version ancienne de l’HASPI. La version 2 donne des prédictions légèrement plus durcies. 

Ce qui est intéressant dans les mesures effectuées en 2021 (publiées en 2022) est la présence d’un mode de mesures « chambre anéchoïque » permettant (enfin !) la comparaison des mesures de QC avec des mesures effectuées par d’autres équipes de recherche, puisque le protocole est alors reproductible. 

Classe I, classe II, pas de différences ? 

Comme en 2019, mais avec des contrastes moins marqués, les aides auditives de classe I semblent avoir des résultats proches de ceux des aides auditives de classe II, et en tous cas forts honorables. 

Cet avis est partagé par les audioprothésistes, certainement par les patients (environ 40% des appareillages en 2021), et les mesures indépendantes confirment cet état de fait : les aides auditives de classe I fonctionnent bien. Ces appareils de classe I étaient les « classe II d’il y a 5 ans et plus », et il me semble bien qu’à l’époque, nous en étions satisfaits dans l’ensemble. 

Cependant, et c’est sur ce point que ces mesures objectives ne reflètent pas la capacité des aides auditives de classe II : toutes les aides auditives sont adaptées en bande passante à une surdité donnée (laquelle ? reflète-t-elle toutes les surdités ?), avec un réglage « de base », c’est-à-dire sans utiliser les capacités étendues des aides auditives. 

Chaque audioprothésiste sait, et chaque patient devrait savoir, qu’une aide auditive de classe I est à son maximum de capacités algorithmiques (traitement du signal) lors de l’adaptation. Il n’est souvent pas possible sur ces appareils de renforcer la détection de la parole, la réduction du bruit ou les modes de directivité. 

C’est là que réside l’énorme avantage des aides auditives de classe II. Leur mode de fonctionnement « automatique » ou de base n’est pas fondamentalement très différent sur le plan de la performance avec les aides auditives de classe I, mais la plupart des aides auditives de classe II donnent accès à des modes de réglages beaucoup plus avancés. 

Voici quelques exemples, chez divers fabricants de fonctions uniquement accessibles en classe II et leurs effets : 

  • le mode de directivité, associé au couplage pour un Paradise P90R : 

Il ne s’agit plus du même appareil si on le teste en « mode auto » et couplage ouvert, ou en directivité renforcée et couplage fermé. L’équivalent en classe I (B30) n’a pas ces possibilités, ni la même amélioration du RSB : 

XD11

  • le renforcement de la parole dans le bruit avec un Signia 7ax : 

XD12

La performance dans le bruit est améliorée de 2 à 3dB en activant conjointement la réduction du bruit et le traitement privilégié de la parole, à des niveaux élevés. L’équivalent classe I chez Signia (3nx) ne permet pas cette amélioration du RSB en sortie d’appareil par les réglages. 

  • la compression basée sur le rapport signal/bruit permet au Bernafon Alpha 9 (ou au Oticon More) de ne pas dégrader la parole aux rapports signal/bruit positifs (absence de « Target Loss »), et donc d’obtenir une amélioration du rapport signal/bruit de quasiment 10dB lorsque les systèmes de renforcement de la parole sont poussés au maximum : 

XD13

Les appareils de classe I chez ces fabricants (Zerena3/Siya) ne possèdent pas ces fonctions, ni de compression basée sur le RSB, ni de réglage du « Target Loss » (renforcement ou stabilité de la parole au fur et à mesure que le RSB se dégrade). 

  • le renforcement des pics de la parole permet au Widex Moment 440 une amélioration du rapport signal/bruit par augmentation du contraste avec le bruit de fond : 

XD14

Cette fonction (« Speech Enhancer » ou SE) n’a pas d’équivalent sur le classe I de la marque (Enjoy). 

Conclusion 

  1. Comme dans beaucoup de domaines, il ne faut pas oublier l’apport de l’être humain (le réglage est dit « opérateur dépendant »). L’efficacité d’un système, à diplôme égal, va varier d’un audioprothésiste à l’autre en fonction des stratégies de réglages utilisées. Ce point influencera la performance finale dans une plus ou moins grande mesure. 
    Une aide auditive n’est donc pas un circuit inerte aux caractéristiques fixes, et son réglage n’est pas (uniquement) mathématique, mais humain également. 
  2. La baisse d’audition sur laquelle est adaptée une aide auditive donnera des résultats très différents non seulement pour le patient, mais également lors des mesures objectives. Par exemple, cette aide auditive adaptée en « mode auto » sur trois audiométries différentes donne trois HASQI (indices de qualité) très différents : 
    Comment juger alors d’un indice de qualité unique ? Et comparer des aides auditives entre elles ? 
    XD15

     
  3. L’opérateur a son importance, l’audiogramme de référence choisi également. Que dire alors du couplage (embout ou dôme auriculaire) utilisé pour l’adaptation ? 
    Les mesures de cet article montrent l’importance de l’évent. Un couplage acoustique optimisé peut totalement transformer les performances d’une aide auditive, encore faut-il qu’elle en ait les capacités intrinsèques. 
  4. Que dire également de systèmes apportant un réel confort aux malentendants aux quotidien et totalement inquantifiables par des mesures de qualité ou d’intelligibilité objectives (mais mesurables et réglables in vivo par les audioprothésistes), comme les réducteurs de bruits impulsionnels, l’écoute musicale, la réduction du bruit du vent, efficacité des anti-larsen, etc. ? 

Ces multiples réglages ne sont souvent disponibles ou efficaces qu’en classe II. 

Une aide auditive de classe I est donc à peu près équivalente à une aide auditive de classe II. Patients et audioprothésistes ont adhéré massivement au 100 % Santé en 2021, levant certains freins à l’appareillage. Il ne faut pas perdre de vue qu’une aide auditive de classe I est au maximum de ses capacités dans le bruit, sans possibilités par l’audioprothésiste, le plus souvent, d’ajuster ces paramètres si le besoin s’en faisait ressentir. 

L’idée fausse qu’une aide auditive de classe II fonctionne de manière équivalente à une aide auditive de classe I vient du fait, le plus souvent, que les fabricants ajustent de façon minimale ou moyenne les réducteurs de bruit, systèmes de renforcement de la parole ou la directivité, très certainement afin d’éviter un traitement du signal qui pourrait être jugé artificiel par les porteurs. 

Sur ce point, nous pouvons constater une amélioration réellement importante ces dernières années, chez tous les fabricants. 

Le choix d’une aide auditive est une concertation, un compromis le plus souvent entre les possibilités du patient et de l’audioprothésiste. Il ne s’agit ni de jouer sur « la peur de perdre », ni de laisser penser que l’audiologie prothétique n’a pas évolué ces cinq dernières années. 

Un indice, tel qu’il est montré ici ou utilisé par Que Choisir ou une équipe de recherche, est forcément réducteur. Par exemple, et pour chaque modèle testé ici ont été analysées de façon croisée : la mesure du comportement à chaque rapport signal/bruit, en faisant varier le traitement du signal, et pour des couplages auriculaires différents ; plusieurs heures d’acquisition et d’analyse à chaque fois. Est-ce suffisant pour justifier un choix ? Certainement pas, et je m’en garderais bien à titre personnel. 

À nous, audioprothésistes, d’argumenter en toute connaissance de cause (et humilité) les impacts du choix de telle ou telle technologie. 

Aux fabricants de fournir aux audioprothésistes des données standardisées (encadrées par l’ANSM ?), précises et détaillant le fonctionnement et les technologies actives des aides auditives actuelles. 

Aux malentendants, de demander aux professionnels de santé des preuves objectives (mesures, tests) montrant l’apport d’une technologie par rapport à une autre, et qui réponde à leurs besoins. 

  

Newsletter

Newsletter

La newsletter Audiologie Demain,

le plus sûr moyen de ne jamais rater les infos essentielles de votre secteur...

Je m'inscris