检索增强生成(RAG)已经成为企业落地大模型最主流的范式。它用「检索 + 生成」的组合,既保留了大模型的语言能力,又把企业自有知识作为可靠的事实来源。但从 Demo 到生产,效果的差距往往不在模型,而在一系列容易被忽视的工程决策。
决策一:如何切分文档
切分粒度直接决定检索质量。切得太碎,单个片段失去上下文;切得太大,又会引入噪声、稀释相关性。我们建议结合文档的语义结构(标题、段落、列表)做自适应切分,并在片段之间保留适度重叠。
决策二:检索策略不止向量
纯向量检索擅长语义匹配,却常常错过精确的关键词、编号与专有名词。生产环境里,向量检索 + 关键词检索的混合方案(并辅以重排序)几乎总是优于单一策略。
决策三:把重排序当成一等公民
召回阶段追求「不漏」,重排序阶段追求「精准」。一个高质量的重排序模型,往往比反复调整向量模型带来更直接的效果提升。
决策四:让答案可溯源
企业用户对「幻觉」零容忍。为每一句生成内容附上引用来源,既能提升可信度,也便于人工复核与持续优化。
决策五:用真实问题持续评测
RAG 系统不是一次性工程。建立基于真实业务问题的评测集,持续度量召回率、准确率与引用正确率,才能在数据与需求变化中保持效果。
RAG 的上限由模型决定,但下限由工程决定。
← 返回全部洞察
分享微信微博复制链接