如何使用 DeepSeek-R1、LangChain 和 Ollama 构建隐私优先的 RAG

k: 检索结果数量控制响应中使用的文档块数量。更高的k: 更多上下文，响应较慢。更低的k: 更少上下文，响应较快。: 相似度阈值根据相关性过滤检索结果。更高的阈值: 仅检索高度相关的块。更低的阈值: 更广泛的上下文但不够精确。

程序汪小陈

919人浏览 · 2025-02-14 10:37:14

程序汪小陈 · 2025-02-14 10:37:14 发布

在本指南中，您将学习如何构建一个 检索增强生成 (RAG) 系统，该系统使用 DeepSeek-R1、LangChain、Ollama 和 Streamlit 在本地处理 PDF 文件。这个逐步教程结合了 LangChain 的模块化能力和 DeepSeek-R1 的隐私优先方法，提供了一个强大的解决方案，用于处理技术、法律和学术文档。

该项目将 LangChain（一个用于 RAG 工作流的 AI 框架）与 Ollama（用于 DeepSeek-r1 本地部署）和 Streamlit（用于用户界面）结合在一起。最终结果是一个能够 本地摄取 PDF 并 快速准确回答问题 的 AI 助手。

在本演示中，我们将使用一个 7B 参数的 DeepSeek-r1 精简模型，但如果您拥有更强大的计算能力，我建议使用其他 DeepSeek\-r1 精简模型。

一、为什么选择私人RAG解决方案？

基于云的AI解决方案功能强大，但通常面临诸如隐私风险和重复成本等挑战。通过利用LangChain的模块化框架，您可以创建一个具有众多优势的本地RAG解决方案：

数据隐私：所有操作都在本地进行，您的数据永远不会离开您的机器。
成本效率：无需昂贵的API订阅，此解决方案是免费的和开源的。
可定制性：LangChain的灵活性使您能够微调文档检索和响应生成管道。
强大的AI：与DeepSeek-R1集成，这是一个优化用于解决问题和技术任务的推理模型。

二、工具和技术：LangChain、DeepSeek-R1、Ollama、ChromaDB 和 Streamlit

该项目由以下部分组成：

LangChain：RAG 流水线的核心框架，支持文档加载器、向量存储和 LLM 的集成。它允许根据您的特定需求定制模块化和可扩展的 AI 工作流程。
DeepSeek-R1：一种用于编码、解决问题和技术任务的推理 LLM。提供多种精简版本以便与 Ollama 进行本地部署。
Ollama：一个命令行工具，简化本地 LLM 和嵌入模型（如 DeepSeek-R1 和 mxbai-embed-large）的部署和管理。
ChromaDB：一个向量数据库，用于存储和检索文档嵌入，以便进行基于相似性的查询。
Streamlit：一个用于构建网页界面的 Python 库，使您的 RAG 应用程序用户友好且易于访问。

三、构建 RAG 流水线：逐步指南

以下是如何设置本地 ChatPDF 解决方案的步骤：

1、安装先决条件

确保您已安装 Python 3.8+ 和 Ollama。运行以下命令：

curl -fsSL https://ollama.com/install.sh | sh   
ollama -v  # 验证安装

下载所需的 AI 模型：

ollama pull deepseek-r1:latest # 默认 7B 模型  
ollama pull mxbai-embed-large  # 嵌入模型

2、设置项目

克隆仓库并设置虚拟环境：

git clone https://github.com/paquino11/chatpdf-rag-deepseek-r1.git   
cd chatpdf-rag-deepseek-r1   
python3 -m venv venv   
source venv/bin/activate

安装依赖：

pip install -r requirements.txt

3、运行应用程序

启动 Streamlit 应用程序：

streamlit run app.py

在浏览器中访问应用程序，地址为 http://localhost:8501。上传您的 PDF 文件，调整检索设置并开始提问。

四、使用 DeepSeek-R1、Ollama、LangChain 和 ChromaDB 构建 RAG 管道

该项目使用 LangChain 管理整个 RAG 工作流：

1、 使用 LangChain 进行 PDF 导入：

使用 LangChain 的 PyPDFLoader 和 RecursiveCharacterTextSplitter 读取并拆分 PDF 文件。
将块嵌入为向量表示，使用 OllamaEmbeddings。

2、使用 ChromaDB 进行文档检索：

LangChain 与 ChromaDB 的集成实现了快速的基于相似度的相关文档块检索。
自定义结果数量 (k) 和相似度阈值 (score_threshold)，以更好地控制。

3、使用 DeepSeek-R1 生成响应：

检索到的文档块被传递给 DeepSeek-R1，生成简洁且准确的答案。
LangChain 的 ChatPromptTemplate 确保 AI 以用户友好的格式进行响应。

五、自定义检索设置以获得最佳结果

LangChain 使调整检索设置以获得最佳性能变得简单：

k: 检索结果数量控制响应中使用的文档块数量。

更高的 k: 更多上下文，响应较慢。
更低的 k: 更少上下文，响应较快。

score_threshold: 相似度阈值根据相关性过滤检索结果。

更高的阈值: 仅检索高度相关的块。
更低的阈值: 更广泛的上下文但不够精确。

六、使用案例和测试您的 RAG 应用程序

以下是一些测试应用程序的示例：

测试PDF：

金融：分析财务报告并提取可行的见解。
医疗：总结研究论文或医疗指南。
教育：从电子书和学术论文中提取摘要或关键点。

示例问题：

“这个 Python 库的关键特性是什么？”
“本合同的第 5 节讨论了什么？”
“总结一下这本电子书的第二章。”

七、结论

通过结合 LangChain、DeepSeek-R1 和 ChromaDB，您可以创建一个优先考虑隐私、灵活性和成本效率的 RAG 系统。这个本地 RAG 解决方案非常适合分析技术文档、法律文本等，而无需依赖基于云的工具。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】