IlyaGusev/xlm_roberta_large_headline_cause_full

IlyaGusev

Clasificación de texto

Este modelo fue entrenado para predecir la presencia de relaciones causales entre dos titulares. Este modelo es para la tarea completa con 7 etiquetas posibles: los títulos son casi iguales, A causa B, B causa A, A refuta B, B refuta A, A está relacionado con B de otra manera, A no está relacionado con B. Se admiten los idiomas inglés y ruso.

Como usar

from tqdm.notebook import tqdm
from transformers import AutoTokenizer, AutoModelForSequenceClassification, pipeline

def get_batch(data, batch_size):
  start_index = 0
  while start_index < len(data):
    end_index = start_index + batch_size
    batch = data[start_index:end_index]
    yield batch
    start_index = end_index

def pipe_predict(data, pipe, batch_size=64):
  raw_preds = []
  for batch in tqdm(get_batch(data, batch_size)):
    raw_preds += pipe(batch)
  return raw_preds

MODEL_NAME = TOKENIZER_NAME = "IlyaGusev/xlm_roberta_large_headline_cause_full"
tokenizer = AutoTokenizer.from_pretrained(TOKENIZER_NAME, do_lower_case=False)
model = AutoModelForSequenceClassification.from_pretrained(MODEL_NAME)
model.eval()
pipe = pipeline("text-classification", model=model, tokenizer=tokenizer, framework="pt", return_all_scores=True)
texts = [
  ("Judge issues order to allow indoor worship in NC churches",
    "Some local churches resume indoor services after judge lifted NC governor’s restriction"),
  ("Gov. Kevin Stitt defends $2 million purchase of malaria drug touted by Trump",
    "Oklahoma spent $2 million on malaria drug touted by Trump"),
  ("Песков опроверг свой перевод на удаленку",
    "Дмитрий Песков перешел на удаленку")
]
pipe_predict(texts, pipe)

Funcionalidades

Clasificación de secuencia con XLM-RoBERTa
7 etiquetas posibles para relaciones causales entre titulares
Soporta idiomas inglés y ruso
Basado en transformers y PyTorch
Compatible con AutoTrain y Endpoints

Casos de uso

Detectar relaciones causales entre titulares de noticias
Analizar cómo un titular puede influir o relacionarse con otro
Usar en análisis de medios de comunicación para identificar relaciones entre eventos