Update K2 Search
30
K2-Search.md
30
K2-Search.md
@@ -96,20 +96,22 @@ Az embedding során egy adott modellel előállítjuk egy *chunk* szemantikai ve
|
||||
|
||||
## Embedding Backendek
|
||||
|
||||
- Ollama
|
||||
- hivatalos Docker image
|
||||
- CPU/GPU support
|
||||
- GGUF formátum
|
||||
- egyedi modellarchitektúrák konvertálása alkalom adtán nehézkes lehet (gemma, nv-embed)
|
||||
- Egyedi (SentenceTransformer)
|
||||
- python alapú szerver, docker konténerben
|
||||
- egyszerű REST API
|
||||
- CPU/GPU support
|
||||
- HF/Transformers modell formátum, a legtöbb modell alapra ebben készül
|
||||
- Spring ONNX integráció
|
||||
- alkalmazásszerverbe épül be
|
||||
- CPU/GPU support
|
||||
- ONNX formátum szükséges, csak támogatott architektúrákkal megy
|
||||
#### Ollama
|
||||
- hivatalos Docker image
|
||||
- CPU/GPU support
|
||||
- GGUF formátum
|
||||
- egyedi modellarchitektúrák konvertálása alkalom adtán nehézkes lehet (gemma, nv-embed)
|
||||
|
||||
#### Egyedi (SentenceTransformer)
|
||||
- python alapú szerver, docker konténerben
|
||||
- egyszerű REST API
|
||||
- CPU/GPU support
|
||||
- HF/Transformers modell formátum, a legtöbb modell alapra ebben készül
|
||||
|
||||
#### Spring ONNX integráció
|
||||
- alkalmazásszerverbe épül be
|
||||
- CPU/GPU support
|
||||
- ONNX formátum szükséges, csak támogatott architektúrákkal megy
|
||||
|
||||
## Embedding Modellek
|
||||
|
||||
|
||||
Reference in New Issue
Block a user