climatebert/environmental-claims
climatebert
Clasificación de texto
El modelo 'environmental-claims' está ajustado finamente en el conjunto de datos EnvironmentalClaims utilizando el modelo preentrenado 'climatebert/distilroberta-base-climate-f'. La metodología subyacente se puede encontrar en nuestro artículo de investigación.
Como usar
Puedes usar el modelo con un pipeline para la clasificación de texto:
from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline
from transformers.pipelines.pt_utils import KeyDataset
import datasets
from tqdm.auto import tqdm
dataset_name = 'climatebert/environmental_claims'
model_name = 'climatebert/environmental-claims'
# Si deseas utilizar tus propios datos, simplemente cárgalos como un dataset de 🤗 Datasets, ver https://huggingface.co/docs/datasets/loading
dataset = datasets.load_dataset(dataset_name, split='test')
model = AutoModelForSequenceClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name, max_len=512)
pipe = pipeline('text-classification', model=model, tokenizer=tokenizer, device=0)
# Ver https://huggingface.co/docs/transformers/main_classes/pipelines#transformers.pipeline
for out in tqdm(pipe(KeyDataset(dataset, 'text'), padding=True, truncation=True)):
print(out)
Funcionalidades
- Clasificación de texto
- Basado en la arquitectura RoBERTa
- Utiliza la biblioteca de 'transformers'
- Compatible con PyTorch
- Compatibilidad con AutoTrain
- Compatible con Endpoints de Inferencia
Casos de uso
- Ayuda a detectar y evaluar afirmaciones ambientales en el mundo real
- Puede tener un impacto positivo en el medio ambiente al futuro