Random Forest
Random Forest (ou decision random forest) sont une méthode d’apprentissage ensemble de classification, de régression et d’autres tâches qui fonctionne en construisant une multitude d’arbres de décision au moment de l’entrainement et produisant de la classe qui est le mode de des classes (classification) ou la prédiction moyenne (régression) des arbres individuels.
Les random forest corrigent l'habitude de suralimentation des arbres de décision par rapport à leur ensemble d'entraînement.
Le premier algorithme pour les forêts de décision au hasard a été créé par Tin Kam Ho en utilisant la méthode de sous - espace aléatoire, qui, dans la formulation de Ho, est un moyen de mettre en œuvre l'approche « discrimination stochastique » à la classification proposée par Eugene Kleinberg.
Une extension de l'algorithme a été développé par Leo B Reiman et Adele Cutler, qui dépose Random Forest comme une marque (en 2019, appartenant à Minitab, Inc.). L’extension combine l’idée de «mise en sac » de Breiman et une sélection aléatoire de caractéristiques, introduites d’abord par H o , puis de manière indépendante par Amit et Geman , afin de constituer une collection d’arbres de décision à variance contrôlée.