SciFive Pubmed Base

razent
Clasificación de texto

SciFive: un modelo transformador de texto a texto para literatura biomédica. Desarrollado por Long N. Phan, James T. Anibal, Hieu Tran, Shaurya Chanana, Erol Bahadroglu, Alec Peltekian, y Grégoire Altan-Bonnet.

Como usar

from transformers import AutoTokenizer, AutoModelForSeq2SeqLM

tokenizer = AutoTokenizer.from_pretrained('razent/SciFive-base-Pubmed')
model = AutoModelForSeq2SeqLM.from_pretrained('razent/SciFive-base-Pubmed')

sentence = 'Identification of APC2 , a homologue of the adenomatous polyposis coli tumour suppressor .'
text = sentence + ' '

encoding = tokenizer.encode_plus(text, pad_to_max_length=True, return_tensors='pt')
input_ids, attention_masks = encoding['input_ids'].to('cuda'), encoding['attention_mask'].to('cuda')

outputs = model.generate(
  input_ids=input_ids, attention_mask=attention_masks,
  max_length=256,
  early_stopping=True
)

for output in outputs:
  line = tokenizer.decode(output, skip_special_tokens=True, clean_up_tokenization_spaces=True)
  print(line)

Funcionalidades

Clasificación de texto
Transformadores
PyTorch
TensorFlow
Generación de texto
Clasificación de tokens
Preguntas y respuestas
Generación de texto en inferencia

Casos de uso

Clasificación de texto
Generación de texto a partir de texto proporcionado
Clasificación de tokens para aplicaciones biomédicas
Respuestas a preguntas basadas en datos biomédicos