Lajavaness/bilingual-embedding-large
Lajavaness
Similitud de oraciones
Modelo de embeddings bilingüe de gran tamaño orientado a similitud semántica entre frases. Está publicado en Hugging Face por Lajavaness, usa principalmente `sentence-transformers` y también `transformers`, y se enfoca en tareas como recuperación, reranking, STS, clasificación y clustering, con resultados especialmente sólidos en benchmarks en francés como Syntec, STS multilingüe y Opusparcus.
Como usar
No aparece un bloque de uso ni fragmentos de código en el extracto proporcionado.
Funcionalidades
- Tipo de pipeline: similitud entre frases
- Biblioteca principal: sentence-transformers
- Bibliotecas adicionales: transformers
- Repositorio/modelo: Lajavaness/bilingual-embedding-large
- Creado el 2024-06-24
- Última modificación el 2024-08-06
- Descargas recientes: 5605
- Descargas históricas: 795054
- Likes: 27
- Sin proveedores de inferencia listados en el extracto
- Buen rendimiento en recuperación y reranking en benchmarks franceses, especialmente Syntec
- Buen rendimiento en STS en francés, incluido STS22 y STSBenchmark multilingüe
- Incluye resultados reportados para clasificación, clustering, pair classification, retrieval, reranking, STS y summarization
Casos de uso
- Búsqueda semántica bilingüe
- Recuperación de documentos y pasajes en francés
- Reranking de resultados para preguntas o consulta-documento
- Detección de similitud semántica entre frases
- Agrupación de textos por significado
- Clasificación basada en embeddings para dominios e intenciones