nomic-embed-text-v1-ablated
nomic-ai
Similitud de oraciones
nomic-embed-text-v1-ablated es un codificador de texto con una longitud de contexto de 8192. Este es un checkpoint entrenado después de modificar el conjunto de datos de entrenamiento para ser diferente del conjunto de datos utilizado para entrenar nuestro modelo final. El propósito de liberar este checkpoint es comprender el impacto que tuvieron los subconjuntos de nuestros datos de entrenamiento en los resultados del modelo. Esta versión es parte de nuestro compromiso con los artefactos de entrenamiento de código abierto de nuestro informe técnico Nomic Embed Text.
Como usar
Si desea utilizar un modelo para extraer embeddings, sugerimos usar nomic-embed-text-v1.
Funcionalidades
- Codificador de texto con longitud de contexto de 8192
- Checkpoint entrenado con un conjunto de datos modificado
- Artefactos de entrenamiento de código abierto
Casos de uso
- Comparación de oraciones
- Extracción de características
- Incrustaciones de texto para inferencia