Mitsua Diffusion CC0
Mitsua Diffusion CC0 es un modelo de difusión de texto a imagen latente, cuyo U-Net está entrenado desde cero utilizando solo imágenes de dominio público/CC0 o con permiso de uso. El codificador de texto y el VAE se toman de la base de Stable Diffusion v2.1. Este modelo se utilizará como base para la actividad de la VTuber AI Elan Mitsua🖌️. Actualmente, el modelo tiene una calidad visual muy baja y una diversidad limitada. Sí, la calidad visual no es tan buena. Se pierde completamente la mayor parte del concepto artístico moderno. Sin embargo, dado que ella es una IA en desarrollo de manera ética, sería un buen punto de partida para Mitsua-chan. Puedes unirte a su entrenamiento en Twitter. Por favor, apoya a Mitsua-chan.🎉 El entrenamiento adicional se realizará de manera completamente opcional. Si estás interesado, haz clic aquí para enviar una aplicación opcional. Estamos activos en un servidor de Discord solo para participantes opt-in. La comunicación es actualmente en japonés.
Como usar
Puedes utilizar este modelo siguiendo estas instrucciones:
N/A
Funcionalidades
- Modelo de difusión de texto a imagen
- Entrenamiento utilizando solo imágenes de dominio público/CC0 o con permiso
- Codificador de texto y VAE tomados de Stable Diffusion v2.1
- Calidad visual baja y diversidad limitada actualmente
- Se utiliza como base para la actividad de una VTuber AI
Casos de uso
- Generación de imágenes a partir de textos
- Uso en actividades de VTuber AI
- Creación de obras de arte digitales en un entorno ético