DeepMount00/Mamba-QA-ITA-790m

DeepMount00
Pregunta y respuesta

El modelo es un sistema generativo de preguntas y respuestas, evolucionado del modelo Mamba con 790 millones de parámetros. Este modelo avanzado es capaz de responder a preguntas complejas y entender cuándo la respuesta no está presente en el contexto proporcionado. La distinción clave entre este modelo y el DeepMount00/Mamba-QA-ITA radica en su rendimiento y escala. Este modelo cuenta con un rendimiento significativamente mejorado y alberga aproximadamente 790 millones de parámetros, un aumento sustancial en comparación con los 370 millones de parámetros del DeepMount00/Mamba-QA-ITA. Además, ofrece respuestas con mayor precisión, mejorando la experiencia del usuario y la fiabilidad de la información.

Como usar

Para utilizar este modelo para preguntas y respuestas avanzadas:

import torch
from transformers import AutoTokenizer
from mamba_ssm.models.mixer_seq_simple import MambaLMHeadModel

model_name = "DeepMount00/Mamba-QA-ITA-790m"

tokenizer = AutoTokenizer.from_pretrained(model_name)
model = MambaLMHeadModel.from_pretrained(model_name, device="cuda", dtype=torch.float16)

def run_qa_mamba(model, question, context):
    input_ids = torch.LongTensor([tokenizer.encode(f"{context}\n\nQ: {question}\nA:")]).cuda()
    output = model.generate(input_ids=input_ids, max_length=2048, eos_token_id=tokenizer.eos_token_id)
    answer = tokenizer.batch_decode(output)[0].replace(f"{context}\n\nQ: {question}\nA:", "").split("\n\n")[0].strip()
    answer = answer.replace("", "")
    return answer

question = """Quante torri ha bologna? """
context = """La torre degli Asinelli è una delle cosiddette due torri di Bologna, simbolo della città, situate in piazza di porta Ravegnana, all'incrocio tra le antiche strade San Donato (ora via Zamboni), San Vitale, Maggiore e Castiglione. Eretta, secondo la tradizione, fra il 1109 e il 1119 dal nobile Gherardo Asinelli, la torre è alta 97,20 metri, pende verso ovest per 2,23 metri e presenta all'interno una scalinata composta da 498 gradini. Ancora non si può dire con certezza quando e da chi fu costruita la torre degli Asinelli. Si presume che la torre debba il proprio nome a Gherardo Asinelli, il nobile cavaliere di fazione ghibellina al quale se ne attribuisce la costruzione, iniziata secondo una consolidata tradizione l'11 ottobre 1109 e terminata dieci anni dopo, nel 1119."""

answer = run_qa_mamba(model, question, context)
print(answer)

Funcionalidades

Parametrización avanzada: con 790 millones de parámetros, el modelo ofrece un equilibrio fino entre eficiencia y capacidad.
Comprensión contextual: el modelo puede discernir cuándo la respuesta a una pregunta no está disponible en el contexto proporcionado, demostrando sus avanzadas capacidades de comprensión.

Casos de uso

Manejo de preguntas complejas: capaz de entender y responder una amplia gama de preguntas complejas.
Eficiencia de parámetros: mantiene alta eficiencia y precisión a pesar de tener menos parámetros en comparación con algunos modelos más grandes.