ESGBERT/EnvironmentalBERT-environmental
ESGBERT
Clasificación de texto
Basado en este artículo, este es el modelo de lenguaje EnvironmentalBERT-environmental. Un modelo de lenguaje que está entrenado para clasificar mejor textos ambientales en el dominio de ESG. Usando el modelo EnvironmentalBERT-base como punto de partida, el modelo de lenguaje EnvironmentalBERT-environmental está adicionalmente entrenado en un conjunto de datos de 2k de textos ambientales para detectar muestras de texto ambiental.
Como usar
Puedes usar el modelo con una pipeline para clasificación de texto:
from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline
tokenizer_name = "ESGBERT/EnvironmentalBERT-environmental"
model_name = "ESGBERT/EnvironmentalBERT-environmental"
model = AutoModelForSequenceClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(tokenizer_name, max_len=512)
pipe = pipeline("text-classification", model=model, tokenizer=tokenizer) # set device=0 to use GPU
# See https://huggingface.co/docs/transformers/main_classes/pipelines#transformers.pipeline
print(pipe("Las emisiones del Alcance 1 se reportan aquí de manera comparativa con la línea base de 2013 y excluyen las emisiones de vehículos adicionales utilizados durante las reparaciones.", padding=True, truncation=True))
Funcionalidades
- Clasificación de texto
- Transformers
- PyTorch
- Compatible con AutoTrain
- Compatible con Endpoints de Inferencia
Casos de uso
- Clasificación de textos ambientales en el dominio de ESG
- Análisis a gran escala de textos ambientales
- Afinamiento de modelos para aplicaciones específicas