L’apprentissage machine ou l’apprentissage automatique (machine learning) est un champ d’étude de l’intelligence artificielle. Il « vise à donner aux machines la capacité d’apprendre à partir de données, via des modèles mathématiques », explique la Cnil. En d’autres termes, un opérateur fournit à la machine – l’ordinateur – une base de données (composées d’images anatomiques, de tableaux de symptômes, d’audiogrammes...) que la machine va compulser. Dans la majorité des cas, ces données sont labellisées, c’est-à-dire qu’elles sont associées à un diagnostic, dans sa phase d'apprentissage. L'ordinateur « apprend » ainsi de chaque paire (donnée-diagnostic) à reconnaître les caractéristiques associées au diagnostic et affine son algorithme au fur et à mesure, afin d’obtenir la meilleure prédiction possible (il s’agit alors d’un apprentissage supervisé). Plus la machine a compulsé de données, plus elle est capable d’identifier précisément la pathologie. Une fois la phase d'entraînement achevée, la machine doit pouvoir fournir le diagnostic le plus probable aux nouvelles images proposées, sans diagnostic associé. La capacité de la machine à produire un diagnostic pertinent dépend de la qualité de la base de données qui l’a entraînée : celle-ci doit être correcte (comporter le moins d’erreurs possible) et variée (provenir de patients différents en âge, sexe ou origine ethnique par exemple).
Les évolutions de l’IA ont également permis de développer un apprentissage non supervisé. Dans ce cas, les données fournies aux machines ne sont pas « annotées », elles ne sont pas associées à un diagnostic. La machine peut alors regrouper les données selon leurs caractéristiques ou découvrir des associations fréquentes de plusieurs caractéristiques.
Inspiré du fonctionnement des schémas neuronaux biologiques, le réseau de neurones artificiels (neural network) est une méthode d’intelligence artificielle basée sur des mécanismes statistiques et probabilistes. Chaque « neurone » analyse une information qui lui est fournie soit directement via une donnée qu’on lui transmet (une image, un son, etc.) soit via des « synapses » (le prolongement des neurones de la couche antérieure) : si cette information dépasse un seuil prédéfini (un nombre de synapses activés, une intensité sonore, etc.), le neurone s'active et passe l'info à la couche suivante. Sinon, il reste au repos. Ces neurones associés en couches permettent de rendre compte de nombreuses caractéristiques – on dit que le réseau est profond s’il contient plusieurs couches. Ainsi, l'addition de différents indices permet d'aboutir à un résultat complexe quand une seule et unique information ne permettrait pas d’arriver à cette conclusion. Schématiquement, le réseau de neurones peut intégrer un grand nombre de données pour aboutir à une réponse simple : la présence ou non d'une pathologie par exemple.
Selon la Cnil, l’apprentissage profond (ou deep learning) est « un procédé d’apprentissage automatique utilisant les réseaux de neurones, possédant plusieurs couches de neurones cachés ». Il s’agit donc d’une évolution des réseaux neuronaux. Basés sur de nombreux paramètres, ces algorithmes nécessitent un très grand nombre de données pour être entraînés.
L’intelligence artificielle générative est un type d’IA capable de créer du contenu (un texte, une image, une vidéo). L’application la plus emblématique est ChatGPT qui est capable de générer des réponses aux questions qui lui sont adressées, voire de converser.
Alors que l’intelligence artificielle utilise actuellement un grand nombre de données disponibles via des connexions internet ou sur des cloud centralisés, des chercheurs tentent de délocaliser le stockage des informations et la réalisation des calculs complexes au plus près, voire directement dans les appareils. On parle alors d’intelligence artificielle embarquée (ou edge AI en anglais). Les assistants virtuels tels Siri d’Apple ou Alexa d’Amazon utilisent ce type de système. Starkey utlise aussi ce mode, déporté sur l’application smartphone. Avantages de cette technologie : elle peut fonctionner sans connexion, limite la circulation importante de données et les sécurise.