Dáta a pamäť

Embedding

Prevod textu na čísla tak, aby podobné texty mali podobné čísla — základ pre sémantické vyhľadávanie a RAG systémy.

Embedding je proces, pri ktorom špeciálny model prevedie text (vetu, odstavec, dokument) na vektor — zoznam čísel, ktorý zachytáva „zmysel" tohto textu. Texty, ktoré sa tematicky podobajú, majú podobné vektory.

Prečo je to dôležité? Embedding umožňuje sémantické vyhľadávanie — nie hľadanie presných slov, ale hľadanie zmyslu. Keď zákazník napíše „môj balíček neprišiel" a váš systém obsahuje dokument o „reklamáciách nedoručených zásielok", embedding ich správne spojí — aj keď nezdieľajú ani jedno spoločné slovo.

Embeddingové modely sú oddelené od generatívnych LLM. Populárne: text-embedding-3-small od OpenAI, voyage-3 od Voyage AI, nomic-embed od Nomic.

Embeddingy sa ukladajú do vektorových databáz a sú základom každého RAG systému. Toto je tá „neviditeľná" technológia, ktorá robí AI agentov skutočne inteligentnými pri práci s vašimi firemnými dokumentmi.

Chcete to využiť vo svojej firme?

Rezervovať bezplatnú konzultáciu
← Späť do slovníka