企业级 RAG 落地的五个关键决策

检索增强生成（RAG）已经成为企业落地大模型最主流的范式。它用「检索 + 生成」的组合，既保留了大模型的语言能力，又把企业自有知识作为可靠的事实来源。但从 Demo 到生产，效果的差距往往不在模型，而在一系列容易被忽视的工程决策。

决策一：如何切分文档

切分粒度直接决定检索质量。切得太碎，单个片段失去上下文；切得太大，又会引入噪声、稀释相关性。我们建议结合文档的语义结构（标题、段落、列表）做自适应切分，并在片段之间保留适度重叠。

纯向量检索擅长语义匹配，却常常错过精确的关键词、编号与专有名词。生产环境里，向量检索 + 关键词检索的混合方案（并辅以重排序）几乎总是优于单一策略。

召回阶段追求「不漏」，重排序阶段追求「精准」。一个高质量的重排序模型，往往比反复调整向量模型带来更直接的效果提升。

企业用户对「幻觉」零容忍。为每一句生成内容附上引用来源，既能提升可信度，也便于人工复核与持续优化。

RAG 系统不是一次性工程。建立基于真实业务问题的评测集，持续度量召回率、准确率与引用正确率，才能在数据与需求变化中保持效果。

RAG 的上限由模型决定，但下限由工程决定。