maastrichtlawtech/colbert-legal-french

maastrichtlawtech

Similitud de oraciones

El modelo Colbert Legal French está diseñado para la recuperación de pasajes legales y la similitud de oraciones. Es una versión afinada del modelo base Camembert que ha sido entrenado específicamente para manejar textos legales en francés.

Como usar

Para usar este modelo en un proyecto, puedes utilizar la API de Inference de Hugging Face para la similitud de oraciones. A continuación se muestra un ejemplo de cómo hacerlo en código:
from transformers import AutoModel, AutoTokenizer

model_name = 'maastrichtlawtech/colbert-legal-french'

tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModel.from_pretrained(model_name)

sentences = ["C'est une personne heureuse", "C'est un chien heureux", "C'est une personne très heureuse", "Aujourd'hui est une journée ensoleillée"]

inputs = tokenizer(sentences, padding=True, truncation=True, return_tensors="pt")
outputs = model(**inputs)
print(outputs)

Funcionalidades

Recuperación de pasajes legales
Similitud de oraciones
Compatibilidad con el formato Safetensors
Uso del modelo base Camembert

Casos de uso

Recuperación de artículos legales
Comparación de similitud entre documentos legales
Análisis de texto legal