DistilCamemBERT-Sentiment

cmarkea
Clasificación de texto

Presentamos DistilCamemBERT-Sentiment, una versión afinada de DistilCamemBERT para la tarea de análisis de sentimiento en el idioma francés. Este modelo se construyó utilizando dos conjuntos de datos: Amazon Reviews y Allociné.fr para minimizar el sesgo. Las reseñas de Amazon son similares en mensajes y relativamente cortas, a diferencia de las críticas de Allociné, que son largas y ricas en texto. El costo de inferencia puede ser un problema tecnológico en modelos basados en CamemBERT, especialmente en la fase de producción. Para contrarrestar este efecto, proponemos este modelo que divide el tiempo de inferencia a la mitad con el mismo consumo de energía gracias a DistilCamemBERT.

Como usar

from transformers import pipeline

analyzer = pipeline(
task='text-classification',
model="cmarkea/distilcamembert-base-sentiment",
tokenizer="cmarkea/distilcamembert-base-sentiment")
result = analyzer(
"J'aime me promener en forêt même si ça me donne mal aux pieds.",
return_all_scores=True
)

result
[{'label': '1 estrella',
'score': 0.047529436647892},
{'label': '2 estrellas',
'score': 0.14150355756282806},
{'label': '3 estrellas',
'score': 0.3586442470550537},
{'label': '4 estrellas',
'score': 0.3181498646736145},
{'label': '5 estrellas',
'score': 0.13417290151119232}]

Funcionalidades

Clasificación de textos
Optimización con DistilCamemBERT
Reducción del tiempo de inferencia a la mitad
Compatibilidad con AutoTrain y Endpoints de Inferencia
Entrenado en conjuntos de datos Amazon Reviews y Allociné

Casos de uso

Análisis de sentimiento en reseñas de productos
Evaluaciones de críticas de cine
Clasificación de textos según la valoración de los usuarios