cointegrated/roberta-large-cola-krishna2020
Este es un clasificador RoBERTa-large entrenado en el corpus CoLA Warstadt et al., 2019, que contiene oraciones emparejadas con juicios de aceptabilidad gramatical. El modelo se puede usar para evaluar la fluidez de las oraciones generadas por máquinas en inglés, por ejemplo, para la evaluación de la transferencia de estilo de texto. El modelo fue entrenado en el artículo Krishna et al., 2020. 'Reformulating Unsupervised Style Transfer as Paraphrase Generation', y su versión original está disponible en su página del proyecto. Convertimos este modelo de Fairseq a formato Transformers. Todo el crédito va a los autores del artículo original.
Como usar
Este modelo puede emplearse para evaluar la aceptabilidad gramatical de las oraciones generadas por IA. Aquí hay un ejemplo de uso en formato Markdown:
from transformers import AutoTokenizer, AutoModelForSequenceClassification
# Cargar el modelo y el tokenizador
modelo = AutoModelForSequenceClassification.from_pretrained('cointegrated/roberta-large-cola-krishna2020')
tokenizador = AutoTokenizer.from_pretrained('cointegrated/roberta-large-cola-krishna2020')
# Ejemplo de texto
texto = 'I like you. I love you'
# Tokenizar el texto
entradas = tokenizador(texto, return_tensors='pt')
# Hacer predicción
resultados = modelo(**entradas)
print(resultados)
Funcionalidades
- Clasificación de texto
- Transformers
- PyTorch
- Safetensors
- RoBERTa
- Compatible con AutoTrain
- Compatible con Endpoints
- Paper en arxiv:2010.05700
Casos de uso
- Evaluación de la fluidez de oraciones generadas por IA
- Transferencia de estilo de texto