maastrichtlawtech/splade-legal-french

maastrichtlawtech

Similitud de oraciones

Modelo para la similitud de oraciones en el ámbito legal en francés. Utiliza la arquitectura CamemBERT y está entrenado y ajustado en el dataset maastrichtlawtech/lleqa. Este modelo es compatible con AutoTrain y puede generar embeddings de texto para su uso en la recuperación de pasajes, el relleno de máscaras y la similitud de oraciones.

Como usar

from transformers import AutoTokenizer, AutoModelForMaskedLM

# Cargar el tokenizador y el modelo
nombre_modelo = "maastrichtlawtech/splade-legal-french"
tokenizer = AutoTokenizer.from_pretrained(nombre_modelo)
model = AutoModelForMaskedLM.from_pretrained(nombre_modelo)

# Ejemplo de uso
entrada = tokenizer("C'est une personne heureuse", return_tensors="pt")
salida = model(**entrada)
print(salida)

Funcionalidades

Similitud de oraciones
Transformers
Safetensors
Relleno de máscaras
Recuperación de pasajes
Generación de embeddings de texto
Compatible con Inference Endpoints

Casos de uso

Recuperación de artículos legales
Relleno de máscaras en textos legales
Identificación de similitud entre oraciones legales
Generación de embeddings de texto para sus aplicaciones legales