simpletuner-josh-test01
jsterlingvids
Texto a imagen
Este es un modelo LoRA derivado de black-forest-labs/FLUX.1-dev. El principal prompt de validación utilizado durante el entrenamiento fue: Una imagen fotorrealista de una hamburguesa en la luna. El codificador de texto no fue entrenado. Puede reutilizar el codificador de texto del modelo base para la inferencia.
Como usar
import torch
from diffusers import DiffusionPipeline
model_id = 'black-forest-labs/FLUX.1-dev'
adapter_id = 'jsterlingvids/simpletuner-josh-test01'
pipeline = DiffusionPipeline.from_pretrained(model_id)
pipeline.load_lora_weights(adapter_id)
prompt = "Una imagen fotorrealista de una hamburguesa en la luna"
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
image = pipeline(
prompt=prompt,
num_inference_steps=20,
generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(1641421826),
width=1024,
height=1024,
guidance_scale=7.5,
).images[0]
image.save("output.png", format="PNG")
Funcionalidades
- Promedio de validación: Una imagen fotorrealista de una hamburguesa en la luna
- Ajustes de validación: CFG: 7.5, Rescale de CFG: 0.0, Pasos: 20, Muestreador: Ninguno, Semilla: 42, Resolución: 1024x1024
- Ajustes de entrenamiento: Épocas de entrenamiento: 75, Pasos de entrenamiento: 1060, Tasa de aprendizaje: 8e-05, Tamaño de lote efectivo: 2, Tamaño de micro-lote: 1, Pasos de acumulación de gradiente: 2, Número de GPUs: 1
- Tipo de predicción: emparejamiento de flujo
- Optimizador: AdamW, bf16 estocástico
- Precisión: BF16 pura
- Quantizado: No
- Xformers: No utilizado
- LoRA Rango: 64
- LoRA Alfa: Ninguno
- LoRA Abandono: 0.1
- Estilo de inicialización de LoRA: por defecto
Casos de uso
- Generar imágenes fotorrealistas de objetos específicos en entornos inusuales
- Mejorar modelos existentes mediante el uso de técnicas LoRA