OpenAlex/bert-base-multilingual-cased-finetuned-openalex-topic-classification-title-abstract

OpenAlex
Clasificación de texto

Este modelo es una versión afinada de bert-base-multilingual-cased en un conjunto de datos etiquetados proporcionado por CWTS. Fue creado con el propósito de poder clasificar trabajos académicos con un conjunto fijo de temas bien definidos. Este NO es el modelo completo que se utiliza para etiquetar trabajos de OpenAlex con un tema. Para eso, consulta el siguiente repositorio de GitHub: OpenAlex Topic Classification. Ese repositorio también contendrá información sobre el preprocesamiento del texto, la modelación, las pruebas y el despliegue.

Como usar

La manera más rápida de usar este modelo en Python es con el siguiente código (asumiendo que tienes instalada la biblioteca transformers):

from transformers import pipeline

title = "{insert-processed-title-here}"
abstract = "{insert-processed-abstract-here}"

classifier = pipeline(model="OpenAlex/bert-base-multilingual-cased-finetuned-openalex-topic-classification-title-abstract", top_k=10, "truncation":True,"max_length":512)

classifier(f""" {title}\n {abstract}""" )

Funcionalidades

Clasificación de temas de publicaciones académicas
Utiliza título y resumen para la clasificación
Basado en el modelo BERT multilingüe
Entrenado con un conjunto de datos etiquetados por CWTS

Casos de uso

Generación rápida de temas basados solo en el título/resumen
Clasificación de trabajos académicos en temas bien definidos
Parte de un modelo más grande que también incorpora información de revistas y características de citas