Kolors-ControlNet-Depth

Kwai-Kolors
Texto a imagen

Kolors-ControlNet-Depth ofrece dos pesos de ControlNet y código de inferencia basado en Kolors-Basemodel: Canny y Depth. Se proporcionan imágenes de ejemplo y soporte de código de inferencia conjunto entre Kolors-IPadapter y Kolors-ControlNet. Para evaluar el rendimiento de los modelos, se compiló un conjunto de prueba de más de 200 imágenes y textos. Expertos en imágenes proporcionaron calificaciones basadas en cuatro criterios: atractivo visual, fidelidad al texto, controlabilidad condicional y satisfacción general. Los resultados específicos muestran que Kolors-ControlNet tiene mejor rendimiento en varias áreas.

Como usar

# Uso de canny ControlNet:
python ./controlnet/sample_controlNet.py ./controlnet/assets/woman_1.png "una chica bonita, alta calidad, ultra clara, colores vivos, resolución ultra alta, mejor calidad, 8k, HD, 4K" Canny

python ./controlnet/sample_controlNet.py ./controlnet/assets/dog.png "panorámico, un lindo perrito blanco sentado en una taza, mirando a la cámara, estilo anime, renderizado 3D, renderizado de octano" Canny

# La imagen se guardará en "controlnet/outputs/"

# Uso de depth ControlNet:
python ./controlnet/sample_controlNet.py ./controlnet/assets/woman_2.png "estilo Makoto Shinkai, colores ricos, una mujer con camisa verde en un campo, paisaje hermoso, fresco y brillante, sombras moteadas, mejor calidad, ultra detalles, 8K" Depth

python ./controlnet/sample_controlNet.py ./controlnet/assets/bird.png "un pájaro de colores vivos, alta calidad, ultra claro, colores vivos, resolución ultra alta, mejor calidad, 8k, HD, 4K" Depth

# La imagen se guardará en "controlnet/outputs/"

# Uso de depth ControlNet + IP-Adapter-Plus:
python ./controlnet/sample_controlNet_ipadapter.py ./controlnet/assets/woman_2.png ./ipadapter/asset/2.png "Una chica con cabello rojo, paisaje hermoso, fresco y brillante, sombras moteadas, mejor calidad, ultra detalles, 8K" Depth

# La imagen se guardará en "controlnet/outputs/"

Funcionalidades

Dos pesos de ControlNet: Canny y Depth
Código de inferencia conjunto con Kolors-IPadapter
Evaluación experta basada en cuatro criterios: atractivo visual, fidelidad al texto, controlabilidad condicional y satisfacción general

Casos de uso

Generación de imágenes con atractivo visual y alta fidelidad al texto
Mantener la estructura espacial en la generación de imágenes
Evaluación experta en características específicas de imágenes generadas