ESGBERT/EnvironmentalBERT-environmental

ESGBERT

Clasificación de texto

Basado en este artículo, este es el modelo de lenguaje EnvironmentalBERT-environmental. Un modelo de lenguaje que está entrenado para clasificar mejor textos ambientales en el dominio de ESG. Usando el modelo EnvironmentalBERT-base como punto de partida, el modelo de lenguaje EnvironmentalBERT-environmental está adicionalmente entrenado en un conjunto de datos de 2k de textos ambientales para detectar muestras de texto ambiental.

Como usar

Puedes usar el modelo con una pipeline para clasificación de texto:
from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline

tokenizer_name = "ESGBERT/EnvironmentalBERT-environmental"
model_name = "ESGBERT/EnvironmentalBERT-environmental"

model = AutoModelForSequenceClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(tokenizer_name, max_len=512)

pipe = pipeline("text-classification", model=model, tokenizer=tokenizer) # set device=0 to use GPU

# See https://huggingface.co/docs/transformers/main_classes/pipelines#transformers.pipeline
print(pipe("Las emisiones del Alcance 1 se reportan aquí de manera comparativa con la línea base de 2013 y excluyen las emisiones de vehículos adicionales utilizados durante las reparaciones.", padding=True, truncation=True))

Funcionalidades

Clasificación de texto
Transformers
PyTorch
Compatible con AutoTrain
Compatible con Endpoints de Inferencia

Casos de uso

Clasificación de textos ambientales en el dominio de ESG
Análisis a gran escala de textos ambientales
Afinamiento de modelos para aplicaciones específicas