智能搜索与LLM的结合：AWS赋能的检索增强型生成

🤖🔍 智能搜索与LLM的结合：AWS赋能的检索增强型生成

利用 AWS 原生服务构建一个检索增强生成 (RAG)代理，该代理可以根据您的内部知识库回答问题。使用Amazon Bedrock、OpenSearch和LangChain创建智能、安全且可扩展的问答系统。

🛠️ 技术栈

LangChain——用于构建 RAG 管道
Amazon Bedrock – 适用于 LLM（Claude、Titan 等）
OpenSearch或Bedrock Knowledge Base – 用于矢量存储
S3 – 用于存储文档
Titan Embeddings——用于语义搜索

📦 安装依赖项

pip install langchain boto3 openai

🔐 AWS 身份验证
设置 AWS CLI 或环境变量：

aws configure

或者：

export AWS_ACCESS_KEY_ID=your_key
export AWS_SECRET_ACCESS_KEY=your_secret
export AWS_REGION=us-east-1

📄 代码：RAG Agent 与 AWS Vector Store

import boto3
from langchain.llms.bedrock import Bedrock
from langchain.chains import RetrievalQA
from langchain.vectorstores import OpenSearchVectorSearch
from langchain.embeddings import BedrockEmbeddings

# 1. Configure LLM and Embeddings
llm = Bedrock(model_id="anthropic.claude-v2", region_name="us-east-1")
embedding = BedrockEmbeddings(model_id="amazon.titan-embed-text-v1", region_name="us-east-1")

# 2. Connect to OpenSearch (or use Bedrock Knowledge Base)
opensearch = OpenSearchVectorSearch(
    opensearch_url="https://your-domain.us-east-1.es.amazonaws.com",
    index_name="your-index-name",
    embedding=embedding
)

# 3. Create RAG pipeline
qa = RetrievalQA.from_chain_type(llm=llm, retriever=opensearch.as_retriever(), return_source_documents=True)

# 4. Ask a question
query = "How does the AWS knowledge base vector search work?"
result = qa({"query": query})

print("Answer:", result["result"])
print("Sources:", result["source_documents"])

📚 可选：使用 AWS Bedrock 知识库
您可以使用 Amazon Bedrock 知识库简化矢量存储：

将您的文档上传到S3。

通过 AWS 控制台创建知识库。

AWS 负责处理数据分块、嵌入和搜索。

使用 Bedrock API 或 LangChain 的 BedrockRetriever 获取结果。

📁 文件夹结构示例

.
├── docs/
│   └── knowledge_base/         # Local or S3 documents
└── rag_aws_agent.py            # Main script

🔄接下来是什么？
🧾支持更多文件类型（PDF、CSV、Markdown）

🧠 添加具有内存和工具的代理

🌐 使用 Streamlit 或 FastAPI 创建 Web 界面

🔐 使用 IAM 角色实现安全访问

💾 存储响应日志和审计跟踪

💡 您可以使用的吸引人的标题
：“与您的 AWS 文档聊天：使用 Amazon Bedrock 构建 RAG 代理”

“RAG即服务：在AWS上使用LangChain实现可扩展的AI问答”

从 S3 到智能搜索：在 AWS 上构建 RAG 机器人

“Amazon Bedrock 与 LangChain 强强联合：创建您自己的问答助手”

✅ 总结：
您现在拥有一个可正常运行的 RAG 代理，它：

从您托管在 AWS 上的知识库中检索内容

使用 Titan Embeddings 和 Claude 来获得智能答案

具有可扩展性、安全性和易于扩展性

想把它变成完整的代码库、Streamlit 演示或 Docker 包吗？尽管开口！

文章来源：https://dev.to/moni121189/smart-search-meets-llm-aws-powered-retrieval-augmented- Generation-2hn7

菜单

分享

智能搜索与LLM的结合：AWS赋能的检索增强型生成 🤖🔍 智能搜索与LLM的结合：AWS赋能的检索增强型生成

智能搜索与LLM的结合：AWS赋能的检索增强型生成

🤖🔍 智能搜索与LLM的结合：AWS赋能的检索增强型生成

🤖🔍 智能搜索与LLM的结合：AWS赋能的检索增强型生成

🛠️ 技术栈

📦 安装依赖项

系统设计面试中的 19 种微服务模式

使用 React 和 AWS Amplify 实现无服务器架构第三部分：跟踪应用使用情况

模型-视图-控制器（MVC）模式到底是什么？DEV 全球项目展示挑战赛，由 Mux 主办：快来展示你的项目吧！

我在两年内从 PHP 开发人员晋升为高级 C#/.NET 开发人员。

了解 Docker：第 12 部分 – 传递构建参数

Yarn 和第三方 NPM 客户端的黑暗未来 DEV 的全球展示与讲述挑战赛，由 Mux 呈现：展示你的项目！

CSS DEV 的全球展示挑战赛“响应式字体”由 Mux 呈现：展示你的项目！

我是如何以学生开发者的身份免费获得 Tabnine Pro 的，你也可以！

五大顶级JS框架

从 Rector PHP 开始：利用自动化改进您的 PHP 代码