Scale-invariant feature transform (SIFT) är en algoritm i datorseende för att extrahera intressepunkter med associerade lokala histogram över lokala gradientriktningar, vilka är rimligt väl opåverkade av skala, rotation och belysning. Algoritmen presenterades 1999 av David Lowe. De s.k. intressepunkterna, som möjliggör skalinvarians, extraheras på ett sätt som utgör en approximation till intressepunktsoperatorer som tidigare utvecklats inom skalrumsteori (se nedan).

Nyckelpunkter i en bild
Nyckelpunkter av samma scen, men från ett annat håll. SIFT används till att hitta korrespondenser.

Tillämpningar redigera

SIFT används till att finna korrespondenser mellan punkter i två eller flera bilder; matchning. Detta kan användas inom flera tillämpningar, till exempel bildregistrering.

Objektigenkänning redigera

Genom att för ett objekt bygga upp en databas med tillhörande SIFT-punkter kan objektet hittas i en godtycklig bild.[1] Träffar mellan bildens och objektets punkter kan hittas och verifieras genom en kontroll mot objektets geometri.

Panorama redigera

Genom att hitta korrespondenser mellan två delvis överlappande bilder kan avbildningen mellan bilderna uppskattas. Efter att avbildningen är uppskattad kan bilderna sys ihop till en enda stor bild. SIFT har framgångsrikt använts till att skapa panoraman helt automatiskt. [2]

Se även redigera

Referenser redigera

Följande två artiklar beskriver i detalj hur SIFT fungerar och hur det kan tillämpas inom objektigenkänning.

Följande artikel utgör originalreferens för att detektera skalinvarianta intressepunkter utifrån skalrumsextrema av det skalnormaliserade Laplace-svaret (Lowe använder en approximation till detta i termer av differenser mellan Gauss-utjämnade bilder):

Noter redigera

  1. ^ Lowe 2004
  2. ^ Recognising panoramas, Brown, M. Lowe, D.G. Dept. of Comput. Sci., British Columbia Univ., Vancouver, BC, Canada; [1]