Réseau de neurones bayésien
Que sont les réseaux de neurones bayésiens ?
Les réseaux de neurones bayésiens (BNN) sont des réseaux standards étendus auxquels s'ajoute une inférence ultérieure visant à contrôler le surajustement. D'un point de vue plus large, l'approche bayésienne emploie une méthodologie statistique, de sorte que tout est associé à une répartition de probabilité, y compris les paramètres des modèles (pondérations et biais dans les réseaux de neurones). Dans les langages de programmation, des variables qui peuvent recevoir une valeur spécifique renvoient le même résultat chaque fois que vous y accédez. Commençons par la révision d'un simple modèle linéaire, qui doit prédire le résultat de la somme pondérée d'une série de fonctionnalités d'entrée.
Quels sont les principaux avantages des BNN ?
- Les réseaux de neurones bayésiens sont utiles pour résoudre des problèmes dans des domaines où les données sont insuffisantes, car ils offrent un moyen d'éviter le surajustement. La biologie moléculaire et le diagnostic médical, des disciplines où les données proviennent d'un travail expérimental difficile et coûteux, en sont deux très bons exemples.
- Les réseaux bayésiens ont une utilité universelle
- Ils peuvent produire de meilleurs résultats pour un grand nombre de tâches, mais il est difficile de les faire évoluer pour traiter des problèmes de grande envergure.
- Les BNN vous permettent de calculer l'erreur associée à vos prédictions lorsque vous traitez les données de cibles inconnues.
- Ils permettent également d'estimer l'incertitude des prédictions, ce qui est particulièrement utile dans des domaines comme la médecine.
Pourquoi utiliser les réseaux de neurones bayésiens ?
Plutôt que de prendre en compte une réponse unique à une question unique, les méthodes bayésiennes vous permettent d'envisager toute une répartition de réponses. Cette approche permet d'aborder naturellement des problématiques telles que :
- la régularisation (surajustement ou non),
- la sélection/comparaison de modèles, sans qu'il faille un dataset distinct de validation croisée