分享
RAGflow 能力拆解
输入“/”快速插入内容
RAGflow 能力拆解
用户4389
用户4389
用户4392
用户4392
用户3862
用户3862
2025年11月26日修改
❤️
原创: Stuart
支持的embedding模型
🌟
RAGflow支持配置上LLM, embedding, STT, img2text, 和内容审核Moderation模型. 配置方式大同小异.
公网MaaS
•
通常只需要一个API key即可对接, 默认提供了通义
千问
. 比较特殊的是OpenAI的接口上提供了修改endpoint, 也就是支持中间商. (下图中Ollma之外的都是公网模型)
实际上RAGflow悄悄的对接了更多公网模型, 在创建数据集时能看到:
50%
50%
实际测试选择这些模型后, RAGflow会尝试从huggingface下载对应的模型.
本地部署
目前仅支持Xinference和Ollama方式部署. 但是实际上只要是API接口一致, 对接方式一致都可以用该方式对接. 此处基础Url只需要写到v1为止, 不需要写embeddings的二级接口.
PS: 添加模型后需要在“系统模型配置”中设置, 方能让模型生效.
文档拆分方式
🥛
RAGflow的思路是面向应用场景提供适配性的文档拆分. 当遇到不在列表中的情况时, 选择通用, 或者类似的场景来使用.
1.
General 通用
在通用模式下, 主要拆分参考是每个块的token数量. 实测中, 它还考虑了语意的完整性, 切分段落的点都在句号或者叹号这种完整句子结束处.
代码块
SQL
"General" 分块方法说明
支持的文件格式为
DOCX、EXCEL、PPT、IMAGE、PDF、TXT
。
此方法将简单的方法应用于块文件:
系统将使用视觉检测模型将连续文本分割成多个片段。
接下来,这些连续的片段被合并成Token数不超过“Token数”的块。
结论: 拆分结果和langchain的拆分大同小异, 没有做其他任何处理和修改.