maastrichtlawtech/splade-legal-french
maastrichtlawtech
Similitud de oraciones
Modelo para la similitud de oraciones en el ámbito legal en francés. Utiliza la arquitectura CamemBERT y está entrenado y ajustado en el dataset maastrichtlawtech/lleqa. Este modelo es compatible con AutoTrain y puede generar embeddings de texto para su uso en la recuperación de pasajes, el relleno de máscaras y la similitud de oraciones.
Como usar
from transformers import AutoTokenizer, AutoModelForMaskedLM
# Cargar el tokenizador y el modelo
nombre_modelo = "maastrichtlawtech/splade-legal-french"
tokenizer = AutoTokenizer.from_pretrained(nombre_modelo)
model = AutoModelForMaskedLM.from_pretrained(nombre_modelo)
# Ejemplo de uso
entrada = tokenizer("C'est une personne heureuse", return_tensors="pt")
salida = model(**entrada)
print(salida)
Funcionalidades
- Similitud de oraciones
- Transformers
- Safetensors
- Relleno de máscaras
- Recuperación de pasajes
- Generación de embeddings de texto
- Compatible con Inference Endpoints
Casos de uso
- Recuperación de artículos legales
- Relleno de máscaras en textos legales
- Identificación de similitud entre oraciones legales
- Generación de embeddings de texto para sus aplicaciones legales