armaGPT

sidharthsajith7
Pregunta y respuesta

armaGPT es una versión finetuned de Gemma 7b, un modelo de lenguaje preentrenado desarrollado por Google. Está diseñado para generar texto similar al humano basado en la entrada que recibe. armaGPT está ajustado utilizando DPO Training para una generación justa y segura.

Como usar

Uso del modelo en CPU

from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("sidharthsajith7/armaGPT")
model = AutoModelForCausalLM.from_pretrained("sidharthsajith7/armaGPT")
input_text = "Write me a poem about Machine Learning."
input_ids = tokenizer(input_text, return_tensors="pt")
outputs = model.generate(**input_ids)
print(tokenizer.decode(outputs[0]))

Uso del modelo en una o varias GPU

# pip install accelerate
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("sidharthsajith7/armaGPT")
model = AutoModelForCausalLM.from_pretrained("sidharthsajith7/armaGPT", device_map="auto")
input_text = "Write me a poem about Machine Learning."
input_ids = tokenizer(input_text, return_tensors="pt").to("cuda")
outputs = model.generate(**input_ids)
print(tokenizer.decode(outputs[0]))

Funcionalidades

Generación de texto similar al humano
Basado en el modelo transformer
Entrenamiento en un contexto de 8192 tokens
Aproximadamente 7 mil millones de parámetros
Compatible con AutoTrain
Compatible con Inferencia de Puntos Finales

Casos de uso

Generación automática de poemas y otros textos creativos
Respuesta automática a preguntas
Asistencia en la redacción de textos
Generación de contenido basado en entrada específica