Les biais en machine learning et en deep learning sont en grande partie les mêmes.
Il existe deux types de biais en machine learning :
- Biais de représentation
les données utilisées pour entraîner les modèles de machine learning peuvent ne pas être représentatives de la population cible. Par exemple, un modèle de reconnaissance faciale entraîné sur un ensemble de données de visages majoritairement blancs peut être plus susceptible d'identifier correctement les visages blancs que les visages noirs. - Biais de sélection
les données utilisées pour entraîner les modèles de machine learning peuvent être biaisées en raison de la façon dont elles ont été sélectionnées. Par exemple, un modèle de prédiction de la criminalité entraîné sur un ensemble de données de crimes commis par des hommes peut être plus susceptible de prédire que les hommes commettent des crimes que les femmes. - Biais de collecte
les données utilisées pour entraîner les modèles de machine learning peuvent être biaisées en raison de la manière dont elles ont été collectées. Par exemple, un modèle de traduction automatique entraîné sur un ensemble de données de traductions provenant de sources occidentales peut être plus susceptible de produire des traductions biaisées vers l'Occident. - Le biais de données
est un biais qui est présent dans les données utilisées pour entraîner les modèles de machine learning. Il peut être dû à des facteurs tels que les préjugés des humains qui ont collecté les données, les biais des outils utilisés pour collecter les données, ou les biais de la société dans laquelle les données ont été collectées.
- Biais de surapprentissage
les modèles de machine learning peuvent être trop sensibles aux données utilisées pour les entraîner, ce qui peut entraîner des biais. Par exemple, un modèle de classification entraîné sur un ensemble de données de spam peut être trop susceptible de classer les e-mails légitimes comme du spam. - Biais de sélection des caractéristiques
les modèles de machine learning peuvent être biaisés par les caractéristiques qui sont utilisées pour les entraîner. Par exemple, un modèle de prédiction de la réussite scolaire peut être biaisé en faveur des étudiants qui ont des parents éduqués. - Biais de la structure de l'algorithme
la structure même de l'algorithme de machine learning peut entraîner des biais. Par exemple, un algorithme de classification basé sur des arbres de décision peut être biaisé en faveur des classes les plus représentées dans les données.
