jeremyhola/LORAs

jeremyhola

Texto a imagen

Repositorio de Hugging Face que agrupa modelos LoRA ajustados con Diffusers LoRA Trainer. La página lo presenta principalmente como un recurso de Text-to-Image con pesos LoRA en Safetensors y un archivo GGUF F16 asociado, aunque la ficha mezcla instrucciones para Diffusers, llama.cpp y herramientas locales de chat/inferencia.

Como usar

Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("HuggingFaceH4/zephyr-7b-beta", dtype=torch.bfloat16, device_map="cuda")
pipe.load_lora_weights("jeremyhola/LORAs")

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

Uso con llama-cpp-python:
# !pip install llama-cpp-python
from llama_cpp import Llama

llm = Llama.from_pretrained(
    repo_id="jeremyhola/LORAs",
    filename="aiorbust/nsfw/Qwen3-4b-Z-Image-Engineer-V4-F16.gguf",
)

llm.create_chat_completion(
    messages = "\"Astronaut riding a horse\""
)

Uso con llama.cpp:
brew install llama.cpp
llama-server -hf jeremyhola/LORAs:F16
llama-cli -hf jeremyhola/LORAs:F16

En Windows:
winget install llama.cpp
llama-server -hf jeremyhola/LORAs:F16
llama-cli -hf jeremyhola/LORAs:F16

Compilación desde código fuente:
git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
cmake -B build
cmake --build build -j --target llama-server llama-cli
./build/bin/llama-server -hf jeremyhola/LORAs:F16
./build/bin/llama-cli -hf jeremyhola/LORAs:F16

Uso con Docker Model Runner u Ollama:
docker model run hf.co/jeremyhola/LORAs:F16
ollama run hf.co/jeremyhola/LORAs:F16

Funcionalidades

Tipo de tarea: Text-to-Image.
Formato de pesos: Diffusers, Safetensors y GGUF.
Plantilla indicada: template:diffusion-lora y conversational.
Licencia: Apache-2.0.
Archivo GGUF listado: aiorbust/nsfw/Qwen3-4b-Z-Image-Engineer-V4-F16.gguf.
Tamaño del modelo GGUF: 4B parámetros, F16, 8.05 GB.
Arquitectura indicada para GGUF: qwen3.
No aparece desplegado en proveedores de inferencia de Hugging Face.
Árbol de modelo mostrado: base mistralai/Mistral-7B-v0.1, fine-tune HuggingFaceH4/zephyr-7b-beta y este repositorio como adaptador.

Casos de uso

Cargar LoRAs de generación de imágenes en pipelines Diffusers.
Probar prompts de Text-to-Image como imágenes de astronautas o escenas estilizadas.
Ejecutar el archivo GGUF F16 localmente con llama.cpp, llama-cpp-python, Ollama, LM Studio o herramientas compatibles.
Servir el modelo localmente mediante un servidor compatible con la API de OpenAI usando llama.cpp.
Experimentar con varios adaptadores LoRA reunidos en un único repositorio.