Öppna huvudmenyn

Bayesiansk statistik eller bayesiansk inferens behandlar hur empiriska observationer förändrar vår kunskap om ett osäkert/okänt fenomen. Det är en gren av statistiken som använder Bayes sats för att kombinera insamlade data med andra informationskällor, exempelvis tidigare studier och expertutlåtanden, till en samlad slutledning. Metodiken har fått sitt namn efter den engelske pastorn Thomas Bayes, som presenterade satsen i en postumt utgiven artikel[1].

Teorin bygger på ett subjektivt sannolikhetsbegrepp, där en sannolikhet representerar personlig grad av tilltro. Det gör det möjligt att använda sannolikheter för händelser som inte kan upprepas (t ex en specifik kärnkraftsolycka) eller t o m ansätta sannolikheter till fixa naturkonstanter eller modellparametrar. Det enda som spelar roll är användarens kunskap om ett fenomen; om man inte känner till värdet av en naturkonstant så beskrivs denna osäkerhet med en sannolikhetsfördelning, oavsett om t ex någon annan känner till värdet på naturkonstanten.

Den snabba datorutvecklingen i kombination med effektiva simuleringsalgoritmer, t.ex. Markov Chain Monte Carlo (MCMC), har bidragit till den bayesianska inferensens växande popularitet i praktiskt statistiskt arbete.[2] Metodiken gör det även möjligt att använda apriorifördelningar som regulariserar flexibla modeller för att undvika överanpassning, t ex kan s k ridge- och lassoregression förklaras som bayesiansk inferens baserat på specifika apriorifördelningar.

Bayesiansk inferens leder till ett naturligt tillvägagångssätt för prediktion och beslutsfattande under osäkerhet, något som har gjort bayesianska metoder populära inom maskininlärning och artificiell intelligens.

Innehåll

MetodRedigera

Den bayesianska inferensen utgår från ett subjektivt, erfarenhetsbaserat, sannolikhetsmått där sannolikheten för en händelse representerar en grad av tilltro till att händelsen inträffar. Bayes sats beskriver hur denna apriorisannolikhet uppdateras med empiriska observationer till en aposteriorisannolikhet. Låt θ beteckna en okänd populationskvantitet, t ex andelen socialdemokrater i Sverige. Från tidigare val och opinionsundersökningar sammanfattas kunskapen kring θ med en apriorifördelning, p(θ). Apriorifördelningen uppdateras när ny information samlas in, t ex en väljarundersökning, med hjälp av bayes sats till en aposteriorifördelning

 

där data är den nya valundersökningen, p(data | θ) är den s k likelihoodfunktionen som beskriver hur sannolika data är för olika värden på θ, och p(data) är marginalsannolikheten för data, som här spelar rollen av relativt oviktig normaliseringskonstant.

Se ävenRedigera

ReferenserRedigera

NoterRedigera

  1. ^ An Essay towards Solving a Problem in the Doctrine of Chances
  2. ^ Diaconis, P: ”The Markov chain Monte Carlo revolution”, Bull. Amer. Math. Soc., sid. 179-205, No 46, 2009.

Tryckta källorRedigera

  • Bayes, Thomas (1763). "An Essay towards Solving a Problem in the Doctrine of Chances" Philosophical Transactions, 53, 370-418. [1]