Lajavaness/bilingual-embedding-large

Lajavaness

Similitud de oraciones

Modelo de embeddings bilingüe de gran tamaño orientado a similitud semántica entre frases. Está publicado en Hugging Face por Lajavaness, usa principalmente `sentence-transformers` y también `transformers`, y se enfoca en tareas como recuperación, reranking, STS, clasificación y clustering, con resultados especialmente sólidos en benchmarks en francés como Syntec, STS multilingüe y Opusparcus.

Como usar

No aparece un bloque de uso ni fragmentos de código en el extracto proporcionado.

Funcionalidades

Tipo de pipeline: similitud entre frases
Biblioteca principal: sentence-transformers
Bibliotecas adicionales: transformers
Repositorio/modelo: Lajavaness/bilingual-embedding-large
Creado el 2024-06-24
Última modificación el 2024-08-06
Descargas recientes: 5605
Descargas históricas: 795054
Likes: 27
Sin proveedores de inferencia listados en el extracto
Buen rendimiento en recuperación y reranking en benchmarks franceses, especialmente Syntec
Buen rendimiento en STS en francés, incluido STS22 y STSBenchmark multilingüe
Incluye resultados reportados para clasificación, clustering, pair classification, retrieval, reranking, STS y summarization

Casos de uso

Búsqueda semántica bilingüe
Recuperación de documentos y pasajes en francés
Reranking de resultados para preguntas o consulta-documento
Detección de similitud semántica entre frases
Agrupación de textos por significado
Clasificación basada en embeddings para dominios e intenciones