Embedding je proces, pri ktorom špeciálny model prevedie text (vetu, odstavec, dokument) na vektor — zoznam čísel, ktorý zachytáva „zmysel" tohto textu. Texty, ktoré sa tematicky podobajú, majú podobné vektory.
Prečo je to dôležité? Embedding umožňuje sémantické vyhľadávanie — nie hľadanie presných slov, ale hľadanie zmyslu. Keď zákazník napíše „môj balíček neprišiel" a váš systém obsahuje dokument o „reklamáciách nedoručených zásielok", embedding ich správne spojí — aj keď nezdieľajú ani jedno spoločné slovo.
Embeddingové modely sú oddelené od generatívnych LLM. Populárne: text-embedding-3-small od OpenAI, voyage-3 od Voyage AI, nomic-embed od Nomic.
Embeddingy sa ukladajú do vektorových databáz a sú základom každého RAG systému. Toto je tá „neviditeľná" technológia, ktorá robí AI agentov skutočne inteligentnými pri práci s vašimi firemnými dokumentmi.