Lajavaness/bilingual-embedding-small

Lajavaness

Similitud de oraciones

Modelo pequeño de embeddings bilingües orientado a similitud semántica. Está publicado en Hugging Face con la tarea principal `sentence-similarity`, usa `sentence-transformers` y también `transformers`, y destaca especialmente en benchmarks en francés de STS, reranking y retrieval. En los resultados visibles, obtiene alrededor de 83.44 de Pearson en STSBenchmarkMultilingualSTS (fr), 82.91 de Spearman en STS22 (fr), 81.68 MAP/MRR en SyntecReranking y 73.18 MRR/MAP@100 en SyntecRetrieval, lo que sugiere un buen equilibrio entre tamaño reducido y rendimiento para búsqueda semántica y comparación de textos en contextos francófonos.

Como usar

No aparece ningún bloque de uso o ejemplo de código dentro del fragmento HTML proporcionado.

Funcionalidades

Tarea principal: similitud entre oraciones (`sentence-similarity`)
Librería principal: `sentence-transformers`
Librería adicional: `transformers`
Modelo de embeddings de tamaño pequeño
Buen rendimiento en STS en francés
Buen rendimiento en reranking y retrieval en benchmarks MTEB francófonos
Repositorio/modelo: `Lajavaness/bilingual-embedding-small`
Creado el 2024-07-17T03:13:47.000Z
Última modificación visible: 2025-07-28T04:03:23.000Z
5429 descargas recientes visibles
1847183 descargas históricas visibles
8 likes visibles

Casos de uso

Búsqueda semántica de documentos y fragmentos en francés
Recuperación de información para RAG con consultas cortas
Reranking de resultados en motores de búsqueda internos
Detección de similitud textual entre preguntas y respuestas
Clustering de textos cortos o medianos
Clasificación basada en embeddings en flujos multilingües ligeros