climatebert/distilroberta-base-climate-detector

climatebert

Clasificación de texto

Este es el modelo de lenguaje ClimateBERT afinado con una cabeza de clasificación para detectar párrafos relacionados con el clima. Utilizando el modelo de lenguaje climatebert/distilroberta-base-climate-f como punto de partida, el modelo distilroberta-base-climate-detector está afinado en nuestro conjunto de datos climatebert/climate_detection. Nota: Este modelo está entrenado en párrafos. Puede que no funcione bien en oraciones.

Como usar

from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline
from transformers.pipelines.pt_utils import KeyDataset
import datasets
from tqdm.auto import tqdm

dataset_name = "climatebert/climate_detection"
model_name = "climatebert/distilroberta-base-climate-detector"

# Si deseas usar tus propios datos, simplemente cárgalos como dataset de 🤗 Datasets, ver https://huggingface.co/docs/datasets/loading
dataset = datasets.load_dataset(dataset_name, split="test")

model = AutoModelForSequenceClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name, max_len=512)

pipe = pipeline("text-classification", model=model, tokenizer=tokenizer, device=0)

# Ver https://huggingface.co/docs/transformers/main_classes/pipelines#transformers.pipeline
for out in tqdm(pipe(KeyDataset(dataset, "text"), padding=True, truncation=True)):
    print(out)

Funcionalidades

Clasificación de texto
Transformer
Compatible con PyTorch
Compatible con Safetensors
Compatible con AutoTrain
Compatible con Endpoints de Inferencia
Licencia Apache 2.0
Región: EE.UU.

Casos de uso

Detección de párrafos relacionados con el clima
Análisis de contenido climático en documentos
Monitorización de divulgaciones climáticas corporativas