maastrichtlawtech/colbert-legal-french
maastrichtlawtech
Similitud de oraciones
El modelo Colbert Legal French está diseñado para la recuperación de pasajes legales y la similitud de oraciones. Es una versión afinada del modelo base Camembert que ha sido entrenado específicamente para manejar textos legales en francés.
Como usar
Para usar este modelo en un proyecto, puedes utilizar la API de Inference de Hugging Face para la similitud de oraciones. A continuación se muestra un ejemplo de cómo hacerlo en código:
from transformers import AutoModel, AutoTokenizer
model_name = 'maastrichtlawtech/colbert-legal-french'
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModel.from_pretrained(model_name)
sentences = ["C'est une personne heureuse", "C'est un chien heureux", "C'est une personne très heureuse", "Aujourd'hui est une journée ensoleillée"]
inputs = tokenizer(sentences, padding=True, truncation=True, return_tensors="pt")
outputs = model(**inputs)
print(outputs)
Funcionalidades
- Recuperación de pasajes legales
- Similitud de oraciones
- Compatibilidad con el formato Safetensors
- Uso del modelo base Camembert
Casos de uso
- Recuperación de artículos legales
- Comparación de similitud entre documentos legales
- Análisis de texto legal