MoMonir/gte-Qwen1.5-7B-instruct-GGUF
MoMonir
Similitud de oraciones
Este modelo fue convertido al formato GGUF desde Alibaba-NLP/gte-Qwen1.5-7B-instruct utilizando llama.cpp. Consulte la tarjeta del modelo original para obtener más detalles sobre el modelo. Nota: Este es un modelo de incrustación. Para más información sobre incrustaciones, consulte el documento de incrustación de OpenAI.
Como usar
Este modelo no tiene suficiente actividad para ser desplegado en la API de inferencia (sin servidor) todavía. Aumente su visibilidad social y vuelva a revisar más tarde, o despliegue en Puntos de Inferencia (dedicados) en su lugar.
Refer to the original model card for more details on the model.
Nota: Este es un modelo de incrustación
Para más información sobre incrustaciones, consulte el documento de incrustación de OpenAI.
Funcionalidades
- Modelo en formato GGUF
- Tamaño del modelo GGUF: 7.72B params
- Arquitectura: qwen2
- Compatibilidad con 4-bit Q4_K_M, 5-bit Q5_K_M, y 6-bit Q6_K
- Similitud de oraciones
Casos de uso
- Incrustaciones de texto
- Similitud de oraciones