Llama-model er en familie af generative AI-modeller udviklet af Meta. Navnet bruges ikke om én enkelt model, men om flere versioner, som er trænet til at forstå mønstre i store mængder data og derefter skabe nyt indhold, for eksempel tekst, kode og i nogle tilfælde også svar på tværs af tekst og billeder. Llama hører til gruppen af såkaldte store sprogmodeller, og nyere udgaver bevæger sig også ind i multimodale modeller.
Hvad er en Llama-model?
En Llama-model fungerer som en grundmodel, der kan bruges til mange forskellige opgaver. Den kan for eksempel opsummere artikler, besvare spørgsmål, oversætte tekst, hjælpe med programmering eller bruges som motor i chatbots. Det særlige ved Llama-familien er, at Meta har gjort modelvægtene bredt tilgængelige under bestemte licensvilkår, hvilket har gjort modellerne populære blandt forskere, virksomheder og udviklere.
Man kan sammenligne Llama med et bilmærke snarere end én bestemt bil. Llama 2, Llama 3 og Llama 4 er forskellige generationer, som bygger videre på hinanden med bedre ydeevne, større kontekstforståelse og flere anvendelser. Nogle versioner er især stærke til tekst, mens andre også kan arbejde med flere typer input.
Hvordan bruges den i praksis?
I praksis kan en Llama-model køre i alt fra forskningsmiljøer til kommercielle produkter. En virksomhed kan bruge den til kundeservice, en redaktion kan teste den til research eller kladdearbejde, og udviklere kan tilpasse modellen til specialiserede opgaver, for eksempel juridisk sprog eller teknisk support. At modellerne kan køre på forskelligt hardware, gør dem også attraktive uden for de største techselskaber.