中小企业 RAG 知识库算力成本结论:RAG = embedding 索引 + 每问 context+生成;top-k≤5、mini 模型 PoC;月 500 问约 20万–80万 Token。10–50 人团队 Dify/FastGPT RAG PoC 到上线:embedding、chunk、top-k、日咨询量与月度 Token 预算表。推荐路径界定知识范围切片与 metadata选 embedding 路径PoC 参数锁死压测 100 问月度预算公式上线治理