DistilCamemBERT-Sentiment
cmarkea
Clasificación de texto
Presentamos DistilCamemBERT-Sentiment, una versión afinada de DistilCamemBERT para la tarea de análisis de sentimiento en el idioma francés. Este modelo se construyó utilizando dos conjuntos de datos: Amazon Reviews y Allociné.fr para minimizar el sesgo. Las reseñas de Amazon son similares en mensajes y relativamente cortas, a diferencia de las críticas de Allociné, que son largas y ricas en texto. El costo de inferencia puede ser un problema tecnológico en modelos basados en CamemBERT, especialmente en la fase de producción. Para contrarrestar este efecto, proponemos este modelo que divide el tiempo de inferencia a la mitad con el mismo consumo de energía gracias a DistilCamemBERT.
Como usar
from transformers import pipeline
analyzer = pipeline(
task='text-classification',
model="cmarkea/distilcamembert-base-sentiment",
tokenizer="cmarkea/distilcamembert-base-sentiment")
result = analyzer(
"J'aime me promener en forêt même si ça me donne mal aux pieds.",
return_all_scores=True
)
result
[{'label': '1 estrella',
'score': 0.047529436647892},
{'label': '2 estrellas',
'score': 0.14150355756282806},
{'label': '3 estrellas',
'score': 0.3586442470550537},
{'label': '4 estrellas',
'score': 0.3181498646736145},
{'label': '5 estrellas',
'score': 0.13417290151119232}]
Funcionalidades
- Clasificación de textos
- Optimización con DistilCamemBERT
- Reducción del tiempo de inferencia a la mitad
- Compatibilidad con AutoTrain y Endpoints de Inferencia
- Entrenado en conjuntos de datos Amazon Reviews y Allociné
Casos de uso
- Análisis de sentimiento en reseñas de productos
- Evaluaciones de críticas de cine
- Clasificación de textos según la valoración de los usuarios