MoMonir/gte-Qwen1.5-7B-instruct-GGUF

MoMonir

Similitud de oraciones

Este modelo fue convertido al formato GGUF desde Alibaba-NLP/gte-Qwen1.5-7B-instruct utilizando llama.cpp. Consulte la tarjeta del modelo original para obtener más detalles sobre el modelo. Nota: Este es un modelo de incrustación. Para más información sobre incrustaciones, consulte el documento de incrustación de OpenAI.

Como usar

Este modelo no tiene suficiente actividad para ser desplegado en la API de inferencia (sin servidor) todavía. Aumente su visibilidad social y vuelva a revisar más tarde, o despliegue en Puntos de Inferencia (dedicados) en su lugar.
Refer to the original model card for more details on the model.

Nota: Este es un modelo de incrustación

Para más información sobre incrustaciones, consulte el documento de incrustación de OpenAI.

Funcionalidades

Modelo en formato GGUF
Tamaño del modelo GGUF: 7.72B params
Arquitectura: qwen2
Compatibilidad con 4-bit Q4_K_M, 5-bit Q5_K_M, y 6-bit Q6_K
Similitud de oraciones

Casos de uso

Incrustaciones de texto
Similitud de oraciones