Update K2 Search

2024-10-24 23:46:35 +02:00
parent 9072af3689
commit e70d6665bf

@@ -96,17 +96,19 @@ Az embedding során egy adott modellel előállítjuk egy *chunk* szemantikai ve
## Embedding Backendek ## Embedding Backendek
- Ollama #### Ollama
- hivatalos Docker image - hivatalos Docker image
- CPU/GPU support - CPU/GPU support
- GGUF formátum - GGUF formátum
- egyedi modellarchitektúrák konvertálása alkalom adtán nehézkes lehet (gemma, nv-embed) - egyedi modellarchitektúrák konvertálása alkalom adtán nehézkes lehet (gemma, nv-embed)
- Egyedi (SentenceTransformer)
#### Egyedi (SentenceTransformer)
- python alapú szerver, docker konténerben - python alapú szerver, docker konténerben
- egyszerű REST API - egyszerű REST API
- CPU/GPU support - CPU/GPU support
- HF/Transformers modell formátum, a legtöbb modell alapra ebben készül - HF/Transformers modell formátum, a legtöbb modell alapra ebben készül
- Spring ONNX integráció
#### Spring ONNX integráció
- alkalmazásszerverbe épül be - alkalmazásszerverbe épül be
- CPU/GPU support - CPU/GPU support
- ONNX formátum szükséges, csak támogatott architektúrákkal megy - ONNX formátum szükséges, csak támogatott architektúrákkal megy