Sådan foregår modeltræning
I praksis får modellen store mængder data, som typisk er udvalgt til at ligne de situationer, den senere skal bruges i. Hvis formålet er at sortere e-mails, trænes modellen for eksempel på mange tidligere beskeder, hvor man allerede ved, hvad der er spam, og hvad der ikke er. Modellen sammenligner sine egne gæt med de rigtige svar og bliver løbende justeret for at mindske fejl.
Ofte deles data op i et træningssæt og et valideringssæt. Træningssættet bruges til selve læringen, mens valideringssættet bruges til at kontrollere, om modellen faktisk bliver bedre, eller blot husker eksemplerne. Det er en vigtig forskel, fordi en model skal kunne fungere på nye data, ikke kun på det, den allerede har set.
Hvorfor kvaliteten af data er afgørende
Modeltræning er ikke kun et spørgsmål om regnekraft. Resultatet afhænger i høj grad af datakvalitet, datasammensætning og valg af metode. Hvis data er skæve, mangelfulde eller fejlmærkede, kan modellen lære de forkerte mønstre. Det kan føre til upræcise eller unfair resultater, for eksempel i ansigtsgenkendelse, kreditvurdering eller automatiseret sagsbehandling.
I moderne AI tales der også om fortræning og finjustering. En model kan først trænes bredt på store datamængder og derefter tilpasses en mere specifik opgave, som kundeservice eller medicinsk tekstanalyse.
Derfor er begrebet vigtigt
Modeltræning er centralt i debatten om AI, fordi det påvirker både kvalitet, bias, energiforbrug og ansvar. Når politikere, virksomheder og borgere diskuterer kunstig intelligens i aktuelle nyheder, er det ofte netop træningen, der afgør, hvor pålidelig og samfundsmæssigt forsvarlig teknologien er.