多模态embeding 支持和llamacpp embeding后端支持 #2768

ZanePoe · 2025-01-17T02:57:20Z

Feature request / 功能建议

支持如gme-Qwen2-VL在内的多模态embeding.由于基于解码器的embeding模型在多语言和跨语言甚至跨模态的embeding效果非常好，但因为基于解码器的embeding模型参数规模比较大，CPU运行的话速度太慢，而且embeding模型相关的量化加速方案也比较少。同时gguf在这方面优势突出，基于解码器的embeding模型也支持灵活的量化方案，也可以充分利用CPU的算力。希望贵团队能够考虑添加llamacpp embeding后端支持。感谢贵团队的开源工作！

Motivation / 动机

/

Your contribution / 您的贡献

/

qinxuye · 2025-01-17T05:22:12Z

社区同学 @pengjunfeng11 正在引入 embedding 的多后端，届时可以引入 llamacpp 后端。

ZanePoe added the feature label Jan 17, 2025

XprobeBot added this to the v1.x milestone Jan 17, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

多模态embeding 支持和llamacpp embeding后端支持 #2768

多模态embeding 支持和llamacpp embeding后端支持 #2768

ZanePoe commented Jan 17, 2025

qinxuye commented Jan 17, 2025

多模态embeding 支持和llamacpp embeding后端支持 #2768

多模态embeding 支持和llamacpp embeding后端支持 #2768

Comments

ZanePoe commented Jan 17, 2025

Feature request / 功能建议

Motivation / 动机

Your contribution / 您的贡献

qinxuye commented Jan 17, 2025