jeremyhola/LORAs
jeremyhola
Texto a imagen
Repositorio de Hugging Face que agrupa modelos LoRA ajustados con Diffusers LoRA Trainer. La página lo presenta principalmente como un recurso de Text-to-Image con pesos LoRA en Safetensors y un archivo GGUF F16 asociado, aunque la ficha mezcla instrucciones para Diffusers, llama.cpp y herramientas locales de chat/inferencia.
Como usar
Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline
# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("HuggingFaceH4/zephyr-7b-beta", dtype=torch.bfloat16, device_map="cuda")
pipe.load_lora_weights("jeremyhola/LORAs")
prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]
Uso con llama-cpp-python:
# !pip install llama-cpp-python
from llama_cpp import Llama
llm = Llama.from_pretrained(
repo_id="jeremyhola/LORAs",
filename="aiorbust/nsfw/Qwen3-4b-Z-Image-Engineer-V4-F16.gguf",
)
llm.create_chat_completion(
messages = "\"Astronaut riding a horse\""
)
Uso con llama.cpp:
brew install llama.cpp
llama-server -hf jeremyhola/LORAs:F16
llama-cli -hf jeremyhola/LORAs:F16
En Windows:
winget install llama.cpp
llama-server -hf jeremyhola/LORAs:F16
llama-cli -hf jeremyhola/LORAs:F16
Compilación desde código fuente:
git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
cmake -B build
cmake --build build -j --target llama-server llama-cli
./build/bin/llama-server -hf jeremyhola/LORAs:F16
./build/bin/llama-cli -hf jeremyhola/LORAs:F16
Uso con Docker Model Runner u Ollama:
docker model run hf.co/jeremyhola/LORAs:F16
ollama run hf.co/jeremyhola/LORAs:F16
Funcionalidades
- Tipo de tarea: Text-to-Image.
- Formato de pesos: Diffusers, Safetensors y GGUF.
- Plantilla indicada: template:diffusion-lora y conversational.
- Licencia: Apache-2.0.
- Archivo GGUF listado: aiorbust/nsfw/Qwen3-4b-Z-Image-Engineer-V4-F16.gguf.
- Tamaño del modelo GGUF: 4B parámetros, F16, 8.05 GB.
- Arquitectura indicada para GGUF: qwen3.
- No aparece desplegado en proveedores de inferencia de Hugging Face.
- Árbol de modelo mostrado: base mistralai/Mistral-7B-v0.1, fine-tune HuggingFaceH4/zephyr-7b-beta y este repositorio como adaptador.
Casos de uso
- Cargar LoRAs de generación de imágenes en pipelines Diffusers.
- Probar prompts de Text-to-Image como imágenes de astronautas o escenas estilizadas.
- Ejecutar el archivo GGUF F16 localmente con llama.cpp, llama-cpp-python, Ollama, LM Studio o herramientas compatibles.
- Servir el modelo localmente mediante un servidor compatible con la API de OpenAI usando llama.cpp.
- Experimentar con varios adaptadores LoRA reunidos en un único repositorio.