akdeniz27/roberta-large-cuad
Este modelo es la versión ajustada de "RoBERTa Large" usando el conjunto de datos CUAD. CUAD, pronunciado "kwad", es un conjunto de datos para la revisión de contratos legales curado por el Proyecto Atticus. La revisión de contratos es una tarea sobre "encontrar agujas en un pajar". Encontramos que los modelos Transformer tienen un rendimiento incipiente en CUAD, pero este rendimiento está fuertemente influenciado por el diseño del modelo y el tamaño del conjunto de datos de entrenamiento. A pesar de algunos resultados prometedores, todavía hay un margen sustancial para mejorar. Como uno de los únicos grandes y especializados benchmarks de PLN anotados por expertos, CUAD puede servir como un desafío de investigación para la comunidad más amplia de PLN.
Como usar
Para empezar a utilizar el modelo, usa el siguiente código:
from transformers import AutoTokenizer, AutoModelForQuestionAnswering
tokenizer = AutoTokenizer.from_pretrained("akdeniz27/roberta-large-cuad")
model = AutoModelForQuestionAnswering.from_pretrained("akdeniz27/roberta-large-cuad")
Funcionalidades
- Revisión de contratos legales
- Ajuste fino de RoBERTa Large utilizando el conjunto de datos CUAD
- Basado en la biblioteca de Transformers de Hugging Face
- Compatible con PyTorch
- Uso de safetensors
Casos de uso
- Revisión de contratos legales para encontrar términos y cláusulas específicas
- Análisis de contratos para identificar posibles problemas legales
- Automatización de la revisión de contratos en bufetes de abogados y departamentos legales