climatebert/distilroberta-base-climate-specificity

climatebert

Clasificación de texto

Este es el modelo de lenguaje ClimateBERT afinado con una cabeza de clasificación para clasificar párrafos relacionados con el clima en párrafos específicos y no específicos. Usando el modelo de lenguaje climatebert/distilroberta-base-climate-f como punto de partida, el modelo distilroberta-base-climate-specificity se afinó en nuestro conjunto de datos climatebert/climate_specificity. Nota: Este modelo está entrenado en párrafos. Puede que no funcione bien en oraciones.

Como usar

Puedes usar el modelo con un pipeline para clasificación de texto:
from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline
from transformers.pipelines.pt_utils import KeyDataset
import datasets
from tqdm.auto import tqdm

dataset_name = "climatebert/climate_specificity"
model_name = "climatebert/distilroberta-base-climate-specificity"

# Si quieres usar tus propios datos, simplemente cárgalos como un conjunto de datos 🤗, ver https://huggingface.co/docs/datasets/loading
dataset = datasets.load_dataset(dataset_name, split="test")

model = AutoModelForSequenceClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name, max_len=512)

pipe = pipeline("text-classification", model=model, tokenizer=tokenizer, device=0)

# Ver https://huggingface.co/docs/transformers/main_classes/pipelines#transformers.pipeline
for out in tqdm(pipe(KeyDataset(dataset, "text"), padding=True, truncation=True)):
    print(out)

Funcionalidades

Clasificación de texto
Compatible con Transformers
Biblioteca PyTorch
Formato Safetensors
Compatible con AutoTrain
Compatible con Endpoints

Casos de uso

Clasificación de párrafos relacionados con el clima en específicos y no específicos
Análisis de divulgaciones climáticas
Evaluación del riesgo de reputación
Relaciones entre iniciativas climáticas y emisiones corporativas