Biais d'automatisation
Qu'est-ce qu'un biais d'automatisation ?
Le biais d'automatisation désigne l'excès de confiance accordée aux assistants automatisés et aux systèmes d'aide à la décision. Les aides automatiques à la décision se généralisent dans des contextes critiques comme les unités de soins intensifs ou les cockpits d'avion. L'humain a une tendance naturelle à suivre la voie du moindre effort cognitif, ce qui explique la prévalence de ce « biais d'automatisation ». Ce concept s'applique également au principe fondamental de fonctionnement de l'IA et de l'automatisation, qui consiste essentiellement à apprendre de grands ensembles de données. Ce type de calcul prend pour hypothèse que, dans le futur, les choses ne seront pas radicalement différentes de ce qu'elles étaient dans le passé. Il faut également garder en tête qu'il existe toujours un risque que les données d'entraînement comportent elles-mêmes des erreurs, ce qui peut fausser l'apprentissage.
Qu'est-ce qu'un biais de machine ?
Le biais de machine désigne la façon dont les algorithmes manifestent les biais présents dans l'algorithme lui-même ou dans les données d'entrée. Aujourd'hui, l'intelligence artificielle (IA) nous aide à extraire de nouvelles informations des données et enrichit la prise de décision humaine. C'est le cas par exemple de la fonction de reconnaissance faciale nous permettant de déverrouiller nos smartphones. Les biais involontaires ont de nombreuses causes (Wikipédia en recense 184) mais on peut dégager trois grands facteurs :
- Échantillons de données incomplets
- Datasets erronés
- Apprentissage déformé par des interactions successives, également appelé « biais d'interaction »
Nous pouvons éviter les biais relatifs aux données en exploitant des datasets complets et volumineux, reflétant tous les cas d'usage marginaux possibles. Plus le dataset est complet et plus les prédictions de l'IA seront précises. Passons en revue les points à prendre en considération lorsque vous travaillez sur votre IA. Choisissez le modèle d'apprentissage adapté au problème. Il n'existe sans doute aucun modèle qui vous prémunisse entièrement des biais, mais certains paramètres peuvent alerter votre équipe au cours du développement. Vous devez identifier le modèle qui convient le mieux à votre situation et soupeser attentivement les idées avant de les mettre en œuvre. Choisissez un dataset d'entraînement représentatif. Veillez à utiliser des données d'entraînement diverses et incluant différents groupes. Supervisez les performances à l'aide de données réelles. Le développement des algorithmes doit être axé sur l'émulation d'applications du monde réel.