climatebert/distilroberta-base-climate-specificity
climatebert
Clasificación de texto
Este es el modelo de lenguaje ClimateBERT afinado con una cabeza de clasificación para clasificar párrafos relacionados con el clima en párrafos específicos y no específicos. Usando el modelo de lenguaje climatebert/distilroberta-base-climate-f como punto de partida, el modelo distilroberta-base-climate-specificity se afinó en nuestro conjunto de datos climatebert/climate_specificity. Nota: Este modelo está entrenado en párrafos. Puede que no funcione bien en oraciones.
Como usar
Puedes usar el modelo con un pipeline para clasificación de texto:
from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline
from transformers.pipelines.pt_utils import KeyDataset
import datasets
from tqdm.auto import tqdm
dataset_name = "climatebert/climate_specificity"
model_name = "climatebert/distilroberta-base-climate-specificity"
# Si quieres usar tus propios datos, simplemente cárgalos como un conjunto de datos 🤗, ver https://huggingface.co/docs/datasets/loading
dataset = datasets.load_dataset(dataset_name, split="test")
model = AutoModelForSequenceClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name, max_len=512)
pipe = pipeline("text-classification", model=model, tokenizer=tokenizer, device=0)
# Ver https://huggingface.co/docs/transformers/main_classes/pipelines#transformers.pipeline
for out in tqdm(pipe(KeyDataset(dataset, "text"), padding=True, truncation=True)):
print(out)
Funcionalidades
- Clasificación de texto
- Compatible con Transformers
- Biblioteca PyTorch
- Formato Safetensors
- Compatible con AutoTrain
- Compatible con Endpoints
Casos de uso
- Clasificación de párrafos relacionados con el clima en específicos y no específicos
- Análisis de divulgaciones climáticas
- Evaluación del riesgo de reputación
- Relaciones entre iniciativas climáticas y emisiones corporativas