weiqiang1978/Flux2-Klein-9B-True-V2

weiqiang1978

Texto a imagen

Flux2-Klein-9B-True-V2 es un modelo de texto a imagen basado en black-forest-labs/FLUX.2-klein-9B y ajustado completamente a partir de FLUX.2-Klein-9B-True-V1. La versión V2 mejora el realismo, la textura, la adherencia al prompt, la compatibilidad con LoRA, la estructura de las imágenes y la edición visual frente a V1. Está publicado como modelo GGUF de 9B parámetros y se distribuye bajo la licencia no comercial de FLUX.

Como usar

Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("weiqiang1978/Flux2-Klein-9B-True-V2", dtype=torch.bfloat16, device_map="cuda")

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

El uso general es el mismo que en la versión V1. Se puede acelerar con Turbo LoRA o Distill LoRA, aunque esto puede reducir la calidad de imagen. Para Turbo LoRA se recomiendan pesos aproximados de 0.2 a 0.3 con 4 a 8 pasos. Para Distill LoRA se recomiendan pesos de 0.4 a 0.6 con 4 a 8 pasos. Para corregir desviaciones de color o forma en edición de imágenes, el autor recomienda el plugin ComfyUI-LCS.

Funcionalidades

Generación de imágenes a partir de texto con arquitectura FLUX.
Ajuste completo sobre la versión V1 para mejorar realismo y textura visual.
Mejor seguimiento y reconstrucción de prompts.
Mayor adaptabilidad de parámetros y mejor compatibilidad con LoRA.
Composición de imagen más ordenada, razonable y con mejoras estéticas.
Mejor comportamiento en edición de imágenes, con menos desplazamiento de píxeles y sesgo de color.
Compatible con Diffusers y uso local en herramientas como Draw Things, DiffusionBee y ComfyUI.

Casos de uso

Generación de imágenes realistas desde prompts de texto.
Creación visual con estética mejorada frente a la versión V1.
Flujos locales de Stable Diffusion/FLUX usando Diffusers, ComfyUI, Draw Things o DiffusionBee.
Experimentación con Turbo LoRA o Distill LoRA para acelerar inferencia.
Edición de imágenes con mejor adherencia al prompt y corrección posterior mediante ComfyUI-LCS.