simpletuner-josh-test01

jsterlingvids

Texto a imagen

Este es un modelo LoRA derivado de black-forest-labs/FLUX.1-dev. El principal prompt de validación utilizado durante el entrenamiento fue: Una imagen fotorrealista de una hamburguesa en la luna. El codificador de texto no fue entrenado. Puede reutilizar el codificador de texto del modelo base para la inferencia.

Como usar

import torch
from diffusers import DiffusionPipeline

model_id = 'black-forest-labs/FLUX.1-dev'
adapter_id = 'jsterlingvids/simpletuner-josh-test01'
pipeline = DiffusionPipeline.from_pretrained(model_id)
pipeline.load_lora_weights(adapter_id)

prompt = "Una imagen fotorrealista de una hamburguesa en la luna"

pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
image = pipeline(
prompt=prompt,
num_inference_steps=20,
generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(1641421826),
width=1024,
height=1024,
guidance_scale=7.5,
).images[0]
image.save("output.png", format="PNG")

Funcionalidades

Promedio de validación: Una imagen fotorrealista de una hamburguesa en la luna
Ajustes de validación: CFG: 7.5, Rescale de CFG: 0.0, Pasos: 20, Muestreador: Ninguno, Semilla: 42, Resolución: 1024x1024
Ajustes de entrenamiento: Épocas de entrenamiento: 75, Pasos de entrenamiento: 1060, Tasa de aprendizaje: 8e-05, Tamaño de lote efectivo: 2, Tamaño de micro-lote: 1, Pasos de acumulación de gradiente: 2, Número de GPUs: 1
Tipo de predicción: emparejamiento de flujo
Optimizador: AdamW, bf16 estocástico
Precisión: BF16 pura
Quantizado: No
Xformers: No utilizado
LoRA Rango: 64
LoRA Alfa: Ninguno
LoRA Abandono: 0.1
Estilo de inicialización de LoRA: por defecto

Casos de uso

Generar imágenes fotorrealistas de objetos específicos en entornos inusuales
Mejorar modelos existentes mediante el uso de técnicas LoRA