l’ensemble général des techniques statistiques peut être divisé en un certain nombre d’activités, dont beaucoup ont des versions bayésiennes spéciales.
inférence Bayésiennemodifier
L’inférence bayésienne fait référence à l’inférence statistique où l’incertitude dans les inférences est quantifiée à l’aide de la probabilité. Dans l’inférence fréquentiste classique, les paramètres et les hypothèses du modèle sont considérés comme fixes. Les probabilités ne sont pas assignées à des paramètres ou des hypothèses dans l’inférence fréquentiste., Par exemple, il n’aurait pas de sens dans l’inférence fréquentiste d’attribuer directement une probabilité à un événement qui ne peut se produire qu’une seule fois, comme le résultat du prochain retournement d’une pièce équitable. Cependant, il serait logique d’affirmer que la proportion de têtes approche de la moitié à mesure que le nombre de retournements de pièces augmente.
Les modèles statistiques spécifient un ensemble d’hypothèses et de processus statistiques qui représentent la façon dont les données de l’échantillon sont générées. Des modèles statistiques ont un certain nombre de paramètres qui peuvent être modifiés., Par exemple, une pièce peut être représentée comme des échantillons d’une distribution de Bernoulli, qui modélise deux résultats possibles. La distribution de Bernoulli a un seul paramètre égal à la probabilité d’un résultat, qui dans la plupart des cas est la probabilité d’atterrir sur les têtes. Concevoir un bon modèle pour les données est centrale dans l’inférence Bayésienne. Dans la plupart des cas, les modèles ne font qu’approximer le processus réel et peuvent ne pas prendre en compte certains facteurs influençant les données. En inférence bayésienne, les probabilités peuvent être assignées aux paramètres du modèle. Les paramètres peuvent être représentés sous forme de variables aléatoires., L’inférence bayésienne utilise le théorème de Bayes pour mettre à jour les probabilités après que plus de preuves soient obtenues ou connues.
statistical modelingEdit
la formulation de modèles statistiques utilisant des statistiques bayésiennes a la particularité d’exiger la spécification de distributions antérieures pour tous les paramètres inconnus. En effet, les paramètres de distributions antérieures peuvent eux-mêmes avoir des distributions antérieures, conduisant à une modélisation hiérarchique Bayésienne, ou peuvent être interdépendants, conduisant à des réseaux bayésiens.,
conception des expérimentationsmodifier
La conception Bayésienne des expériences comprend un concept appelé « influence des croyances antérieures ». Cette approche utilise des techniques d’analyse séquentielle pour inclure les résultats d’expériences antérieures dans la conception de l’expérience suivante. Ceci est réalisé en mettant à jour les « croyances » grâce à l’utilisation de la distribution antérieure et postérieure. Cela permet la conception d’expériences à faire bon usage des ressources de tous types. Un exemple de ceci est le problème des bandits multi-armés.,
analyse exploratoire des modèles Bayésiensmodifier
L’analyse exploratoire des modèles bayésiens est une adaptation ou une extension de l’approche d’analyse exploratoire des données aux besoins et particularités de la modélisation Bayésienne. Dans les mots de Persi Diaconis:
L’analyse exploratoire des données cherche à révéler la structure, ou des descriptions simples dans les données. Nous regardons des chiffres ou des graphiques et essayons de trouver des modèles., Nous poursuivons les pistes suggérées par les informations de base, l’imagination, les modèles perçus et l’expérience avec d’autres analyses de données
le processus d’inférence génère une distribution postérieure, qui joue un rôle central dans les statistiques bayésiennes, ainsi que d’autres distributions comme la distribution prédictive postérieure et La visualisation, l’analyse et l’interprétation correctes de ces distributions sont essentielles pour répondre correctement aux questions qui motivent le processus d’inférence.,habillé outre l’inférence elle-même:
- Diagnostics de la qualité de l’inférence, cela est nécessaire lors de l’utilisation de méthodes numériques telles que les techniques de Monte Carlo De La Chaîne de Markov
- critique de modèle, y compris les évaluations des hypothèses du modèle et des prédictions du modèle
- comparaison des modèles, y compris la sélection du modèle ou la moyenne du modèle
- préparation des résultats pour un public particulier
toutes ces tâches font partie de l’analyse exploratoire de l’approche des modèles bayésiens et leur exécution réussie est centrale pour la processus de modélisation itératif et interactif., Ces tâches nécessitent des résumés numériques et visuels.