Update K2 Search

2024-10-24 23:42:36 +02:00
parent f6fdcfed23
commit c0c50b486a

@@ -155,7 +155,8 @@ A vektorok irányát és/vagy távolságát kiszámítva megállapítható, hogy
## Reranking ## Reranking
A vektoros keresés eredményeként visszaadott találatokat értékeli újra relevancia szerint. A vektoros keresés eredményeként kapott találatok gyakran az összes relevánsnak tűnő dokumentumot tartalmazzák, de nem relevancia szerinti sorrendben.
A reranking során egy erre tanított modellel az egyes találatokat relevancia szerint súlyozzuk, majd ennek megfelelően rendezzük.
- Egyedi reranker service (FlagReranker) - Egyedi reranker service (FlagReranker)
- python alapú szerver, docker konténerben - python alapú szerver, docker konténerben
@@ -166,11 +167,16 @@ A vektoros keresés eredményeként visszaadott találatokat értékeli újra re
- a *bge-gemma2* és *gte-Qwen2* modellekkel jól tud együttműködni - a *bge-gemma2* és *gte-Qwen2* modellekkel jól tud együttműködni
# Válaszgenerálás # Válaszgenerálás
A keresési találatok alapján LLM segítségével megpróbálunk egy választ adni a felhasználó kérdésére.
Ehhez fontos, hogy a modell rendelkezésére bocsássuk a kérdés megválaszolásához az összes releváns információt.
A találatokhoz tartozó metaadatok segítségével a válasz pontos referenciákat tartalmazhat.
- OpenAI API GPT4-en keresztül generált - OpenAI API GPT4-en keresztül generált
- Prompt: - A prompt felépítése:
- instrukciók - instrukciók
- relevánsnak ítélt kontextus - relevánsnak ítélt kontextus
- user query - user query
- Az első két keresési találat chunkjait (és a hozzájuk tartozó contextet) tartalmazza a kérés kontextje - Az első két keresési találat chunkjait (és a hozzájuk tartozó contextet) tartalmazza a kérés kontextje
- A kérés REST API-n történik, a válasz egyben meg van várva, nincsen streamelve - A kérés REST API-n történik, a válasz egyben van megvárva (nincsen streamelve)
- A felhasználó számára egy elkülönített szövegdobozban jelenik meg - A felhasználó számára egy elkülönített szövegdobozban jelenik meg