armaGPT
sidharthsajith7
Pregunta y respuesta
armaGPT es una versión finetuned de Gemma 7b, un modelo de lenguaje preentrenado desarrollado por Google. Está diseñado para generar texto similar al humano basado en la entrada que recibe. armaGPT está ajustado utilizando DPO Training para una generación justa y segura.
Como usar
Uso del modelo en CPU
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("sidharthsajith7/armaGPT")
model = AutoModelForCausalLM.from_pretrained("sidharthsajith7/armaGPT")
input_text = "Write me a poem about Machine Learning."
input_ids = tokenizer(input_text, return_tensors="pt")
outputs = model.generate(**input_ids)
print(tokenizer.decode(outputs[0]))
Uso del modelo en una o varias GPU
# pip install accelerate
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("sidharthsajith7/armaGPT")
model = AutoModelForCausalLM.from_pretrained("sidharthsajith7/armaGPT", device_map="auto")
input_text = "Write me a poem about Machine Learning."
input_ids = tokenizer(input_text, return_tensors="pt").to("cuda")
outputs = model.generate(**input_ids)
print(tokenizer.decode(outputs[0]))
Funcionalidades
- Generación de texto similar al humano
- Basado en el modelo transformer
- Entrenamiento en un contexto de 8192 tokens
- Aproximadamente 7 mil millones de parámetros
- Compatible con AutoTrain
- Compatible con Inferencia de Puntos Finales
Casos de uso
- Generación automática de poemas y otros textos creativos
- Respuesta automática a preguntas
- Asistencia en la redacción de textos
- Generación de contenido basado en entrada específica