nomic-embed-text-v1-ablated

nomic-ai
Similitud de oraciones

nomic-embed-text-v1-ablated es un codificador de texto con una longitud de contexto de 8192. Este es un checkpoint entrenado después de modificar el conjunto de datos de entrenamiento para ser diferente del conjunto de datos utilizado para entrenar nuestro modelo final. El propósito de liberar este checkpoint es comprender el impacto que tuvieron los subconjuntos de nuestros datos de entrenamiento en los resultados del modelo. Esta versión es parte de nuestro compromiso con los artefactos de entrenamiento de código abierto de nuestro informe técnico Nomic Embed Text.

Como usar

Si desea utilizar un modelo para extraer embeddings, sugerimos usar nomic-embed-text-v1.

Funcionalidades

Codificador de texto con longitud de contexto de 8192
Checkpoint entrenado con un conjunto de datos modificado
Artefactos de entrenamiento de código abierto

Casos de uso

Comparación de oraciones
Extracción de características
Incrustaciones de texto para inferencia