weiqiang1978/Flux2-Klein-9B-True-V2
Flux2-Klein-9B-True-V2 es un modelo de texto a imagen basado en black-forest-labs/FLUX.2-klein-9B y ajustado completamente a partir de FLUX.2-Klein-9B-True-V1. La versión V2 mejora el realismo, la textura, la adherencia al prompt, la compatibilidad con LoRA, la estructura de las imágenes y la edición visual frente a V1. Está publicado como modelo GGUF de 9B parámetros y se distribuye bajo la licencia no comercial de FLUX.
Como usar
Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline
# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("weiqiang1978/Flux2-Klein-9B-True-V2", dtype=torch.bfloat16, device_map="cuda")
prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]
El uso general es el mismo que en la versión V1. Se puede acelerar con Turbo LoRA o Distill LoRA, aunque esto puede reducir la calidad de imagen. Para Turbo LoRA se recomiendan pesos aproximados de 0.2 a 0.3 con 4 a 8 pasos. Para Distill LoRA se recomiendan pesos de 0.4 a 0.6 con 4 a 8 pasos. Para corregir desviaciones de color o forma en edición de imágenes, el autor recomienda el plugin ComfyUI-LCS.
Funcionalidades
- Generación de imágenes a partir de texto con arquitectura FLUX.
- Ajuste completo sobre la versión V1 para mejorar realismo y textura visual.
- Mejor seguimiento y reconstrucción de prompts.
- Mayor adaptabilidad de parámetros y mejor compatibilidad con LoRA.
- Composición de imagen más ordenada, razonable y con mejoras estéticas.
- Mejor comportamiento en edición de imágenes, con menos desplazamiento de píxeles y sesgo de color.
- Compatible con Diffusers y uso local en herramientas como Draw Things, DiffusionBee y ComfyUI.
Casos de uso
- Generación de imágenes realistas desde prompts de texto.
- Creación visual con estética mejorada frente a la versión V1.
- Flujos locales de Stable Diffusion/FLUX usando Diffusers, ComfyUI, Draw Things o DiffusionBee.
- Experimentación con Turbo LoRA o Distill LoRA para acelerar inferencia.
- Edición de imágenes con mejor adherencia al prompt y corrección posterior mediante ComfyUI-LCS.