Lajavaness/bilingual-embedding-small
Lajavaness
Similitud de oraciones
Modelo pequeño de embeddings bilingües orientado a similitud semántica. Está publicado en Hugging Face con la tarea principal `sentence-similarity`, usa `sentence-transformers` y también `transformers`, y destaca especialmente en benchmarks en francés de STS, reranking y retrieval. En los resultados visibles, obtiene alrededor de 83.44 de Pearson en STSBenchmarkMultilingualSTS (fr), 82.91 de Spearman en STS22 (fr), 81.68 MAP/MRR en SyntecReranking y 73.18 MRR/MAP@100 en SyntecRetrieval, lo que sugiere un buen equilibrio entre tamaño reducido y rendimiento para búsqueda semántica y comparación de textos en contextos francófonos.
Como usar
No aparece ningún bloque de uso o ejemplo de código dentro del fragmento HTML proporcionado.
Funcionalidades
- Tarea principal: similitud entre oraciones (`sentence-similarity`)
- Librería principal: `sentence-transformers`
- Librería adicional: `transformers`
- Modelo de embeddings de tamaño pequeño
- Buen rendimiento en STS en francés
- Buen rendimiento en reranking y retrieval en benchmarks MTEB francófonos
- Repositorio/modelo: `Lajavaness/bilingual-embedding-small`
- Creado el 2024-07-17T03:13:47.000Z
- Última modificación visible: 2025-07-28T04:03:23.000Z
- 5429 descargas recientes visibles
- 1847183 descargas históricas visibles
- 8 likes visibles
Casos de uso
- Búsqueda semántica de documentos y fragmentos en francés
- Recuperación de información para RAG con consultas cortas
- Reranking de resultados en motores de búsqueda internos
- Detección de similitud textual entre preguntas y respuestas
- Clustering de textos cortos o medianos
- Clasificación basada en embeddings en flujos multilingües ligeros