EnViT5-base

VietAI
Pregunta y respuesta

EnViT5-base es un modelo de codificador-decodificador basado en Transformer preentrenado de última generación para vietnamita e inglés, utilizado en el artículo de MTet.

Como usar

Para más detalles, consulte nuestro repositorio de Github. Ejemplos de ajuste fino se pueden encontrar aquí.

from transformers import AutoTokenizer, AutoModelForSeq2SeqLM

tokenizer = AutoTokenizer.from_pretrained("VietAI/envit5-base")
model = AutoModelForSeq2SeqLM.from_pretrained("VietAI/envit5-base")
model.cuda()

# Necesita prefijo para oraciones en: vi: y en: 
inputs = [
"vi: VietAI es una organización sin fines de lucro con la misión de cultivar talentos en inteligencia artificial y construir una comunidad de expertos en el campo de la inteligencia artificial de clase mundial en Vietnam.",
"vi: Según el último informe de Linkedin sobre la lista de trabajos prometedores con salarios atractivos para el año 2020, los títulos de trabajos relacionados con la IA, como Especialista en Inteligencia Artificial (Artificial Intelligence Specialist) e Ingeniero de Aprendizaje Automático (Machine Learning Engineer), se ubican en posiciones altas.",
"en: Nuestros equipos aspiran a hacer descubrimientos que impacten a todos, y la clave de nuestro enfoque es compartir nuestra investigación y herramientas para impulsar el progreso en el campo.",
"en: Estamos en un viaje para avanzar y democratizar la inteligencia artificial a través de código abierto y ciencia abierta."
]

outputs = model.generate(tokenizer(inputs, return_tensors="pt", padding=True).input_ids.to('cuda'), max_length=512)
print(tokenizer.batch_decode(outputs, skip_special_tokens=True))

Funcionalidades

Modelo basado en Transformer preentrenado
Compatible con idiomas vietnamita e inglés
Generación de texto
Traducción
Resumir

Casos de uso

Generación de texto
Traducción de textos del vietnamita al inglés y viceversa
Resumir textos en vietnamita e inglés