prithivMLmods/EBook-Creative-Cover-Flux-LoRA

prithivMLmods
Texto a imagen

LoRA para FLUX.1-dev orientado a generar portadas creativas de ebooks con títulos, nombres de autor y composiciones editoriales. Está diseñado para prompts que empiezan con la palabra disparadora "EBook Cover" y funciona mejor en formatos cuadrados o verticales. El autor indica que el modelo todavía está en fase de entrenamiento, por lo que puede producir artefactos o resultados inconsistentes en algunos casos.

Como usar

Instalación y uso con Diffusers:

pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", dtype=torch.bfloat16, device_map="cuda")
pipe.load_lora_weights("prithivMLmods/EBook-Creative-Cover-Flux-LoRA")

prompt = "EBook Cover, An eye-level view of an ancient ruins, with the words \"ECHOES OF THE PAST\" written in gold in the center of the image. The ruins are made of stone, and the pillars are adorned with intricate carvings. In the background, a mountain can be seen. The sky is a muted yellow, and at the top, the word \"By Cesar Blair\" is written in a bold black font."
image = pipe(prompt).images[0]

Configuración local indicada en la tarjeta del modelo:

import torch
from pipelines import DiffusionPipeline

base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "prithivMLmods/EBook-Creative-Cover-Flux-LoRA"
trigger_word = "EBook Cover"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)

Para activar el estilo del LoRA, el prompt debe incluir "EBook Cover". Ejemplo: una portada titulada "The Lost Path" con fondo azul oscuro desgastado, marcas de brújula, título metálico plateado y nombre de autora debajo.

Funcionalidades

Generación de imágenes de portadas de ebooks mediante Diffusers y FLUX.1-dev.
Adaptador LoRA disponible en formato Safetensors.
Palabra disparadora recomendada: "EBook Cover".
Dimensiones recomendadas: 1024 x 1024 por defecto y 768 x 1024 para formato vertical.
Entrenado con 17 imágenes de alta resolución etiquetadas con florence2-en.
Configuración de entrenamiento indicada: AdamW, LR scheduler constant, network dim 64, alpha 32, 15 epochs y 2240 pasos.

Casos de uso

Crear conceptos visuales para portadas de ebooks de ficción, misterio, fantasía o aventura.
Prototipar diseños verticales de portada con título y autor integrados en la imagen.
Generar variaciones rápidas de cubiertas editoriales para pruebas creativas.
Usar FLUX.1-dev con un LoRA especializado en composición de portada y texto decorativo.