Öppna huvudmenyn
Bilden visar hur djupinlärning är en underkategori av maskininlärning och hur maskininlärning är en underkategori av artificiell intelligens (AI).

Maskininlärning (engelska: machine learning) är ett område inom datavetenskapen som handlar om metoder för att få datorer att "lära" sig utifrån data utan att datorerna har programmerats för just den uppgiften. Området angränsar till statistik, artificiell intelligens och mönsterigenkänning. Datautvinning (datamining) är ett betydelsenära begrepp som avser en kombiniation av maskininlärning och statistiska metoder för att upptäcka och visualisera mönster i stora mängder data.

Maskininlärningsmetoder arbetar med data. Ofta kan datan delas in i indata (den information som datorn får tillgång till) och utdata (det svar som datorn förväntas ge efter att ha bearbetat indatan). En definition av maskininlärning har skapats av Tom M. Mitchell[1]. Han definierar de algoritmer som studeras inom maskininlärning som "ett datorprogram sägs lära av erfarenhet E givet en uppgift T och ett prestandamått P om dess prestanda på uppgiften T, mätt med P, ökar med erfarenhet E".

Typer av problem och uppgifterRedigera

Problem inom maskininlärning delas ofta in i två större kategorier, beroende på situationen de används i:

  • Övervakat lärande (supervised learning): Om det finns exempel på indata och utdata, och datorn ska lära sig att replikera exemplen och generalisera dem.
  • Oövervakat lärande (unsupervised learning): I detta fall finns det ingen utdata, och datorn får således lära sig underliggande strukturer endast via indatan (och inte genom någon given förväntad utdata).

En alternativ kategorisering av maskininlärning får man beroende på vilket format utdatan har:

  • Inom klassificering består utdatan av en eller flera klasser. Ett exempel på klassificering är spamfiltrering, där indata är e-post-meddelanden och utdatan är klasserna "spam" och "inte spam". Detta är typiskt för övervakat lärande.
  • Inom regression tar utdatan kontinuerliga värden. Ett exempel på regression är att förutsäga vädret, där indata kan vara dagens väder och utdata temperaturen imorgon. Detta är typiskt för övervakat lärande.
  • Inom klustring är syftet att indata skall delas upp i flera grupper. En skillnad mot klassificering är att det inte är klart vilka grupper som finns i förväg. Detta är typiskt för oövervakat lärande.
  • Dimensionalitetsreduktion förenklar indata genom att överföra den till en rymd med lägre dimensionalitet, exempelvis genom principalkomponentanalys.

TillämpningarRedigera

MjukvaraRedigera

Många maskininlärningsalgoritmer finns implementerade i öppen programvara.

Öppen programvaraRedigera

Se ävenRedigera

ReferenserRedigera

  1. ^ Mitchell, T. (1997). Machine Learning. McGraw Hill. sid. 2. ISBN 0-07-042807-7 

Externa länkarRedigera