brtaydin/gte-Qwen2-7B-instruct-Q5_K_M-GGUF
Este modelo fue convertido al formato GGUF desde Alibaba-NLP/gte-Qwen2-7B-instruct usando llama.cpp a través del espacio GGUF-my-repo de ggml.ai. Consulte la tarjeta del modelo original para obtener más detalles sobre el modelo.
Como usar
Instalar llama.cpp a través de brew (funciona en Mac y Linux):
brew install llama.cpp
Invocar el servidor de llama.cpp o el CLI.
CLI:
llama-cli --hf-repo brtaydin/gte-Qwen2-7B-instruct-Q5_K_M-GGUF --hf-file gte-qwen2-7b-instruct-q5_k_m.gguf -p "El significado de la vida y el universo es"
Servidor:
llama-server --hf-repo brtaydin/gte-Qwen2-7B-instruct-Q5_K_M-GGUF --hf-file gte-qwen2-7b-instruct-q5_k_m.gguf -c 2048
También puede utilizar este punto de control directamente a través de los pasos de uso listados en el repositorio Llama.cpp.
Paso 1: Clonar llama.cpp desde GitHub.
git clone https://github.com/ggerganov/llama.cpp
Paso 2: Entrar en la carpeta llama.cpp y construirlo con la bandera LLAMA_CURL=1 junto con otras banderas específicas para el hardware (por ejemplo, LLAMA_CUDA=1 para GPUs Nvidia en Linux).
cd llama.cpp && LLAMA_CURL=1 make
Paso 3: Ejecutar inferencia a través del binario principal.
./llama-cli --hf-repo brtaydin/gte-Qwen2-7B-instruct-Q5_K_M-GGUF --hf-file gte-qwen2-7b-instruct-q5_k_m.gguf -p "El significado de la vida y el universo es"
./llama-server --hf-repo brtaydin/gte-Qwen2-7B-instruct-Q5_K_M-GGUF --hf-file gte-qwen2-7b-instruct-q5_k_m.gguf -c 2048
Funcionalidades
- Similaridad de oraciones
- Transformadores
- GGUF
- Instrucción Q5_K_M
Casos de uso
- Clasificación de opiniones en Amazon
- Clasificación de polaridad en Amazon
- Clasificación de reseñas en Amazon
- Evaluación en el conjunto de pruebas ArguAna