Mitsua Diffusion CC0

Mitsua

Texto a imagen

Mitsua Diffusion CC0 es un modelo de difusión de texto a imagen latente, cuyo U-Net está entrenado desde cero utilizando solo imágenes de dominio público/CC0 o con permiso de uso. El codificador de texto y el VAE se toman de la base de Stable Diffusion v2.1. Este modelo se utilizará como base para la actividad de la VTuber AI Elan Mitsua🖌️. Actualmente, el modelo tiene una calidad visual muy baja y una diversidad limitada. Sí, la calidad visual no es tan buena. Se pierde completamente la mayor parte del concepto artístico moderno. Sin embargo, dado que ella es una IA en desarrollo de manera ética, sería un buen punto de partida para Mitsua-chan. Puedes unirte a su entrenamiento en Twitter. Por favor, apoya a Mitsua-chan.🎉 El entrenamiento adicional se realizará de manera completamente opcional. Si estás interesado, haz clic aquí para enviar una aplicación opcional. Estamos activos en un servidor de Discord solo para participantes opt-in. La comunicación es actualmente en japonés.

Como usar

Puedes utilizar este modelo siguiendo estas instrucciones:
N/A

Funcionalidades

Modelo de difusión de texto a imagen
Entrenamiento utilizando solo imágenes de dominio público/CC0 o con permiso
Codificador de texto y VAE tomados de Stable Diffusion v2.1
Calidad visual baja y diversidad limitada actualmente
Se utiliza como base para la actividad de una VTuber AI

Casos de uso

Generación de imágenes a partir de textos
Uso en actividades de VTuber AI
Creación de obras de arte digitales en un entorno ético