Update K2 Search
11
K2-Search.md
11
K2-Search.md
@@ -117,23 +117,26 @@ A vektorok előállításához használt modellek nagyban befolyásolják a kere
|
|||||||
Jellemzően a kevesebb paraméteres, de specifikusan embedding célra tanított modellek jobban teljesítenek, mint a komplexebb modellek.
|
Jellemzően a kevesebb paraméteres, de specifikusan embedding célra tanított modellek jobban teljesítenek, mint a komplexebb modellek.
|
||||||
További előny, ha a modell tanító adathalmaza a célnyelvnek megfelelő szöveget tartalmazott.
|
További előny, ha a modell tanító adathalmaza a célnyelvnek megfelelő szöveget tartalmazott.
|
||||||
|
|
||||||
- Llama 3.2 72B
|
#### Llama 3.2 72B
|
||||||
- Backend: Ollama
|
- Backend: Ollama
|
||||||
- Tapasztalat:
|
- Tapasztalat:
|
||||||
Az egyes embeddingek vektorai túl hasonlóak, ezért nem alkalmasak keresésre
|
Az egyes embeddingek vektorai túl hasonlóak, ezért nem alkalmasak keresésre
|
||||||
- gte-Qwen2-7B-instruct
|
|
||||||
|
#### gte-Qwen2-7B-instruct
|
||||||
- Backend: Ollama
|
- Backend: Ollama
|
||||||
- A töbnyelvű embedding rangsorban 2. helyezett jelenleg
|
- A töbnyelvű embedding rangsorban 2. helyezett jelenleg
|
||||||
- Tapasztalat:
|
- Tapasztalat:
|
||||||
Ez a modell specifikusan embedding célokra van tanítva, ezért a generált vektorok között nagyobb a távolság, jól kereshető.
|
Ez a modell specifikusan embedding célokra van tanítva, ezért a generált vektorok között nagyobb a távolság, jól kereshető.
|
||||||
A kisebb paraméterszám ellenére is jobb találatokat ad, mint a Llama3.2 modell.
|
A kisebb paraméterszám ellenére is jobb találatokat ad, mint a Llama3.2 modell.
|
||||||
Ezen felül sokkal gyorsabb a vektorok generálása, az előzetes embedding generálás és a felhasználó keresések során egyaránt.
|
Ezen felül sokkal gyorsabb a vektorok generálása, az előzetes embedding generálás és a felhasználó keresések során egyaránt.
|
||||||
- bge-multilingual-gemma2
|
|
||||||
|
#### bge-multilingual-gemma2
|
||||||
- Backend: egyedi (SentenceTransformer)
|
- Backend: egyedi (SentenceTransformer)
|
||||||
- A töbnyelvű embedding rangsorban 1. helyezett jelenleg
|
- A töbnyelvű embedding rangsorban 1. helyezett jelenleg
|
||||||
- Tapasztalat:
|
- Tapasztalat:
|
||||||
A Qwen embedding modellhez hasonlóan szintén jól összehasonlítható vektorokat generál.
|
A Qwen embedding modellhez hasonlóan szintén jól összehasonlítható vektorokat generál.
|
||||||
- nv-embed-v2
|
|
||||||
|
#### nv-embed-v2
|
||||||
- Backend: egyedi (SentenceTransformer)
|
- Backend: egyedi (SentenceTransformer)
|
||||||
- Új modell (2024. 09.)
|
- Új modell (2024. 09.)
|
||||||
- Az embedding modell rangsor élén áll jelenleg
|
- Az embedding modell rangsor élén áll jelenleg
|
||||||
|
|||||||
Reference in New Issue
Block a user