climatebert/environmental-claims

climatebert
Clasificación de texto

El modelo 'environmental-claims' está ajustado finamente en el conjunto de datos EnvironmentalClaims utilizando el modelo preentrenado 'climatebert/distilroberta-base-climate-f'. La metodología subyacente se puede encontrar en nuestro artículo de investigación.

Como usar

Puedes usar el modelo con un pipeline para la clasificación de texto:

from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline
from transformers.pipelines.pt_utils import KeyDataset
import datasets
from tqdm.auto import tqdm

dataset_name = 'climatebert/environmental_claims'
model_name = 'climatebert/environmental-claims'

# Si deseas utilizar tus propios datos, simplemente cárgalos como un dataset de 🤗 Datasets, ver https://huggingface.co/docs/datasets/loading
dataset = datasets.load_dataset(dataset_name, split='test')

model = AutoModelForSequenceClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name, max_len=512)

pipe = pipeline('text-classification', model=model, tokenizer=tokenizer, device=0)

# Ver https://huggingface.co/docs/transformers/main_classes/pipelines#transformers.pipeline
for out in tqdm(pipe(KeyDataset(dataset, 'text'), padding=True, truncation=True)):
    print(out)

Funcionalidades

Clasificación de texto
Basado en la arquitectura RoBERTa
Utiliza la biblioteca de 'transformers'
Compatible con PyTorch
Compatibilidad con AutoTrain
Compatible con Endpoints de Inferencia

Casos de uso

Ayuda a detectar y evaluar afirmaciones ambientales en el mundo real
Puede tener un impacto positivo en el medio ambiente al futuro