cointegrated/roberta-large-cola-krishna2020

cointegrated
Clasificación de texto

Este es un clasificador RoBERTa-large entrenado en el corpus CoLA Warstadt et al., 2019, que contiene oraciones emparejadas con juicios de aceptabilidad gramatical. El modelo se puede usar para evaluar la fluidez de las oraciones generadas por máquinas en inglés, por ejemplo, para la evaluación de la transferencia de estilo de texto. El modelo fue entrenado en el artículo Krishna et al., 2020. 'Reformulating Unsupervised Style Transfer as Paraphrase Generation', y su versión original está disponible en su página del proyecto. Convertimos este modelo de Fairseq a formato Transformers. Todo el crédito va a los autores del artículo original.

Como usar

Este modelo puede emplearse para evaluar la aceptabilidad gramatical de las oraciones generadas por IA. Aquí hay un ejemplo de uso en formato Markdown:

from transformers import AutoTokenizer, AutoModelForSequenceClassification

# Cargar el modelo y el tokenizador
modelo = AutoModelForSequenceClassification.from_pretrained('cointegrated/roberta-large-cola-krishna2020')
tokenizador = AutoTokenizer.from_pretrained('cointegrated/roberta-large-cola-krishna2020')

# Ejemplo de texto
texto = 'I like you. I love you'

# Tokenizar el texto
entradas = tokenizador(texto, return_tensors='pt')

# Hacer predicción
resultados = modelo(**entradas)
print(resultados)

Funcionalidades

Clasificación de texto
Transformers
PyTorch
Safetensors
RoBERTa
Compatible con AutoTrain
Compatible con Endpoints
Paper en arxiv:2010.05700

Casos de uso

Evaluación de la fluidez de oraciones generadas por IA
Transferencia de estilo de texto