Algorithme d'arbre de jonction
L’algorithme d'arbre de jonction (également connu sous le nom « algorithme somme-produit ») est une méthode utilisée dans la machine learning pour extraire la marginalisation en général graphiques.
En gros, cela implique de réaliser une propagation de croyance sur un graphe modifié appelé arbre de jonction.
Le graphique s'appelle un arbre parce qu'il se divise en différentes sections de données; les nœuds de variables sont les branches. Le principe de base est d’éliminer les cycles en les regroupant en nœuds simples. Plusieurs classes étendues de requêtes peuvent être compilées simultanément dans des structures de données plus grandes. Il existe différents algorithmes pour répondre à des besoins spécifiques et pour ce qui doit être calculé. Les algorithmes d’inférence rassemblent les nouveaux développements dans les données et les calculent en fonction des nouvelles informations fournies.
Dans l’apprentissage automatique, les méthodes du noyau sont une classe d’algorithmes d’analyse de motif, dont le membre le plus connu est le support vector machine (SVM). La tâche générale de l'analyse de modèle est de rechercher et d'étudier des types généraux de relations (par exemple des grappes, des classements, des composantes principales, des corrélations, des classifications) dans des ensembles de données. Pour de nombreux algorithmes qui résolvent t tâches es, les données de représentation premières doivent être explicitement transformé en fonction vecteur représentations via un spécifié par l’utilisateur fonction carte : en revanche, les méthodes du noyau ne nécessitent que spécifié par l’utilisateur noyau, par exemple, une fonction de similarité sur paires de points de données en représentation brute.
Les méthodes de noyau doivent leur nom à l'utilisation des fonctions du noyau, qui leur permettre de fonctionner dans un espace de fonction implicite de grande dimension, sans jamais calculer les coordonnées des données dans cet espace, mais plutôt par un simple calcul des produits internes entre les images de toutes les paires de données dans l’espace mémoire. Cette opération est souvent moins coûteuse en calcul que le calcul explicite des coordonnées. Cette approche s'appelle "l’astuce du noyau " . Des fonctions de noyau ont été introduites pour les données de séquence, des graphiques, texte, images, ainsi que les vecteurs.
Les algorithmes capables de fonctionner avec des noyaux incluent le perceptron du noyau, les machines à vecteurs de support (SVM), les processus gaussiens, l’analyse en composantes principales (PCA), l’analyse de corrélation canonique, la régression des arêtes, la classification spectrale, les filtres adaptatifs linéaires, etc. Toute modèle linéaire peut être transformé en un modèle non linéaire en appliquant le tour du noyau au mode l: remplacement de ses caractéristiques (prédicteurs) par une fonction de noyau.
La plupart des algorithmes du noyau sont basés sur une optimisation convexe ou des problèmes propres et sont statistiquement fondés. En règle générale, leurs propriétés statistiques sont analysées à l'aide de la théorie de l'apprentissage statistique (par exemple, en utilisant la complexité de Rademacher).