akdeniz27/roberta-large-cuad

akdeniz27
Pregunta y respuesta

Este modelo es la versión ajustada de "RoBERTa Large" usando el conjunto de datos CUAD. CUAD, pronunciado "kwad", es un conjunto de datos para la revisión de contratos legales curado por el Proyecto Atticus. La revisión de contratos es una tarea sobre "encontrar agujas en un pajar". Encontramos que los modelos Transformer tienen un rendimiento incipiente en CUAD, pero este rendimiento está fuertemente influenciado por el diseño del modelo y el tamaño del conjunto de datos de entrenamiento. A pesar de algunos resultados prometedores, todavía hay un margen sustancial para mejorar. Como uno de los únicos grandes y especializados benchmarks de PLN anotados por expertos, CUAD puede servir como un desafío de investigación para la comunidad más amplia de PLN.

Como usar

Para empezar a utilizar el modelo, usa el siguiente código:

from transformers import AutoTokenizer, AutoModelForQuestionAnswering

tokenizer = AutoTokenizer.from_pretrained("akdeniz27/roberta-large-cuad")

model = AutoModelForQuestionAnswering.from_pretrained("akdeniz27/roberta-large-cuad")

Funcionalidades

Revisión de contratos legales
Ajuste fino de RoBERTa Large utilizando el conjunto de datos CUAD
Basado en la biblioteca de Transformers de Hugging Face
Compatible con PyTorch
Uso de safetensors

Casos de uso

Revisión de contratos legales para encontrar términos y cláusulas específicas
Análisis de contratos para identificar posibles problemas legales
Automatización de la revisión de contratos en bufetes de abogados y departamentos legales