climatebert/distilroberta-base-climate-commitment

climatebert

Clasificación de texto

Este es el modelo de lenguaje ClimateBERT afinado con una cabeza de clasificación para clasificar párrafos relacionados con el clima en párrafos sobre compromisos y acciones climáticas y párrafos que no son sobre compromisos y acciones climáticas. Utilizando el modelo de lenguaje `climatebert/distilroberta-base-climate-f` como punto de partida, el modelo `distilroberta-base-climate-commitment` está afinado en nuestro conjunto de datos `climatebert/climate_commitments_actions`. Nota: Este modelo está entrenado en párrafos. Puede no rendir bien en oraciones.

Como usar

Puedes usar el modelo con una pipeline para clasificación de texto:
from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline
from transformers.pipelines.pt_utils import KeyDataset
import datasets
from tqdm.auto import tqdm

dataset_name = "climatebert/climate_commitments_actions"
model_name = "climatebert/distilroberta-base-climate-commitment"

# Si deseas usar tus propios datos, simplemente cárgalos como un conjunto de datos de 🤗 Datasets, ver https://huggingface.co/docs/datasets/loading
dataset = datasets.load_dataset(dataset_name, split="test")

model = AutoModelForSequenceClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name, max_len=512)

pipe = pipeline("text-classification", model=model, tokenizer=tokenizer, device=0)

# Ver https://huggingface.co/docs/transformers/main_classes/pipelines#transformers.pipeline
for out in tqdm(pipe(KeyDataset(dataset, "text"), padding=True, truncation=True)):
    print(out)

Funcionalidades

Transformadores
PyTorch
Safetensors
Compatibilidad con AutoTrain
Compatibilidad con Endpoints
Licencia Apache-2.0

Casos de uso

Clasificación de párrafos relacionados con compromisos y acciones climáticas
Análisis de divulgaciones climáticas en documentos corporativos