OpenAlex/bert-base-multilingual-cased-finetuned-openalex-topic-classification-title-abstract
OpenAlex
Clasificación de texto
Este modelo es una versión afinada de bert-base-multilingual-cased en un conjunto de datos etiquetados proporcionado por CWTS. Fue creado con el propósito de poder clasificar trabajos académicos con un conjunto fijo de temas bien definidos. Este NO es el modelo completo que se utiliza para etiquetar trabajos de OpenAlex con un tema. Para eso, consulta el siguiente repositorio de GitHub: OpenAlex Topic Classification. Ese repositorio también contendrá información sobre el preprocesamiento del texto, la modelación, las pruebas y el despliegue.
Como usar
La manera más rápida de usar este modelo en Python es con el siguiente código (asumiendo que tienes instalada la biblioteca transformers):
from transformers import pipeline
title = "{insert-processed-title-here}"
abstract = "{insert-processed-abstract-here}"
classifier = pipeline(model="OpenAlex/bert-base-multilingual-cased-finetuned-openalex-topic-classification-title-abstract", top_k=10, "truncation":True,"max_length":512)
classifier(f""" {title}\n {abstract}""" )
Funcionalidades
- Clasificación de temas de publicaciones académicas
- Utiliza título y resumen para la clasificación
- Basado en el modelo BERT multilingüe
- Entrenado con un conjunto de datos etiquetados por CWTS
Casos de uso
- Generación rápida de temas basados solo en el título/resumen
- Clasificación de trabajos académicos en temas bien definidos
- Parte de un modelo más grande que también incorpora información de revistas y características de citas