Een korte introductie tot begeleid en onbewaakt leren


Het vakgebied machine learning omvat een enorme reeks algoritmen die kunnen worden gebruikt om gegevens te begrijpen. Deze algoritmen kunnen worden ingedeeld in een van de volgende twee categorieën:

1. Algoritmen voor begeleid leren: omvatten het bouwen van een model om een uitkomst te schatten of te voorspellen op basis van een of meer inputs.

2. Ongecontroleerde leeralgoritmen: omvatten het vinden van structuur en relaties uit input. Er is geen “supervisie”-output.

In deze tutorial wordt het verschil tussen deze twee soorten algoritmen uitgelegd, samen met verschillende voorbeelden van elk.

Begeleide leeralgoritmen

Een begeleid leeralgoritme kan worden gebruikt als we een of meer verklarende variabelen hebben ( X1, de responsvariabele:

Y = f (X) + ε

waarbij f de systematische informatie vertegenwoordigt die X over Y verschaft en waarbij ε een willekeurige foutterm is die onafhankelijk is van X met een gemiddelde van nul.

Begeleide leeralgoritmen

Er zijn twee hoofdtypen algoritmen voor begeleid leren:

1. Regressie: de uitvoervariabele is continu (bijvoorbeeld gewicht, lengte, tijd, enz.)

2. Classificatie: De outputvariabele is categorisch (bijvoorbeeld mannelijk of vrouwelijk, succes of mislukking, goedaardig of kwaadaardig, enz.)

Er zijn twee belangrijke redenen waarom we algoritmen voor begeleid leren gebruiken:

1. Voorspelling: We gebruiken vaak een reeks verklarende variabelen om de waarde van een responsvariabele te voorspellen (bijvoorbeeld door vierkante meters en het aantal slaapkamers te gebruiken om de prijs van een huis te voorspellen).

2. Gevolgtrekking: We zijn wellicht geïnteresseerd in het begrijpen hoe een responsvariabele wordt beïnvloed wanneer de waarde van de verklarende variabelen verandert (bijvoorbeeld: hoeveel stijgt de prijs van onroerend goed gemiddeld als het aantal kamers met één toeneemt?)

Afhankelijk van of ons doel gevolgtrekking of voorspelling is (of een combinatie van beide), kunnen we verschillende methoden gebruiken om de functie f te schatten. Lineaire modellen bieden bijvoorbeeld eenvoudiger interpretatie, maar moeilijk te interpreteren niet-lineaire modellen kunnen nauwkeurigere voorspellingen bieden.

Hier is een lijst met de meest gebruikte algoritmen voor begeleid leren:

  • Lineaire regressie
  • Logistieke regressie
  • Lineaire discriminantanalyse
  • Kwadratische discriminantanalyse
  • Beslissingsbomen
  • Naïeve Bayes
  • Ondersteuning van vectormachines
  • Neurale netwerken

Ongecontroleerde leeralgoritmen

Een leeralgoritme zonder toezicht kan worden gebruikt als we een lijst met variabelen hebben ( X 1 , data.

Ongecontroleerde leeralgoritmen in machine learning

Er zijn twee hoofdtypen onbewaakte leeralgoritmen:

1. Clustering: Met behulp van dit soort algoritmen proberen we ‘clusters’ van waarnemingen in een dataset te vinden die op elkaar lijken. Dit wordt vaak gebruikt in de detailhandel wanneer een bedrijf groepen klanten met vergelijkbare koopgewoonten wil identificeren, zodat ze specifieke marketingstrategieën kunnen ontwikkelen die zich op bepaalde klantgroepen richten.

2. Associatie: Met behulp van dit soort algoritmen proberen we ‘regels’ te vinden die kunnen worden gebruikt om associaties tot stand te brengen. Detailhandelaren kunnen bijvoorbeeld een associatie-algoritme ontwikkelen dat aangeeft dat “als een klant product X koopt, de kans groot is dat hij ook product Y koopt.”

Hier is een lijst met de meest gebruikte algoritmen voor onbewaakt leren:

  • Hoofdcomponentenanalyse
  • K-betekent clustering
  • Groepering van K-medoïden
  • Hiërarchische classificatie
  • A priori-algoritme

Samenvatting: Begeleid of onbewaakt leren

De volgende tabel vat de verschillen samen tussen begeleide en niet-gecontroleerde leeralgoritmen:

Begeleid of onbewaakt leren

En het volgende diagram vat de soorten machine learning-algoritmen samen:

Machine learning-algoritmen met of zonder toezicht

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert