nahham/llama-2-7b-RandomGPT-5K-ar-Q4_K_M-GGUF

nahham
Pregunta y respuesta

Este modelo fue convertido al formato GGUF desde sajaw/llama-2-7b-RandomGPT-5K-ar utilizando llama.cpp a través del espacio GGUF-my-repo de ggml.ai. Consulte la tarjeta de modelo original para obtener más detalles sobre el modelo.

Como usar

Instalar llama.cpp a través de brew (funciona en Mac y Linux)

brew install llama.cpp

Invocar el servidor de llama.cpp o la CLI. CLI:

llama-cli --hf-repo nahham/llama-2-7b-RandomGPT-5K-ar-Q4_K_M-GGUF --hf-file llama-2-7b-randomgpt-5k-ar-q4_k_m.gguf -p "The meaning to life and the universe is"

Servidor:

llama-server --hf-repo nahham/llama-2-7b-RandomGPT-5K-ar-Q4_K_M-GGUF --hf-file llama-2-7b-randomgpt-5k-ar-q4_k_m.gguf -c 2048

Nota: También puede usar este punto de control directamente a través de los pasos de uso listados en el repositorio de Llama.cpp.

Paso 1: Clonar llama.cpp desde GitHub.

git clone https://github.com/ggerganov/llama.cpp

Paso 2: Moverse a la carpeta llama.cpp y construirlo con la bandera LLAMA_CURL=1 junto con otras banderas específicas de hardware (por ejemplo: LLAMA_CUDA=1 para GPUs Nvidia en Linux).

cd llama.cpp && LLAMA_CURL=1 make

Paso 3: Ejecutar la inferencia a través del binario principal.

./llama-cli --hf-repo nahham/llama-2-7b-RandomGPT-5K-ar-Q4_K_M-GGUF --hf-file llama-2-7b-randomgpt-5k-ar-q4_k_m.gguf -p "The meaning to life and the universe is"

o

./llama-server --hf-repo nahham/llama-2-7b-RandomGPT-5K-ar-Q4_K_M-GGUF --hf-file llama-2-7b-randomgpt-5k-ar-q4_k_m.gguf -c 2048

Funcionalidades

Respuesta a preguntas
Apache-2.0 licencia
Formato GGUF
Arquitectura llama 4-bit Q4_K_M

Casos de uso

Respuesta a preguntas