我们希望实现一个小型知识库的整理与检索功能,结合 ChatGPT 企业版的 Retrieval Plugin,实现类似“持久记忆”的效果。项目需要完成知识库整理、矢量数据库部署与配置,以及插件调试,确保 ChatGPT 在新对话中能够无缝调用知识库内容。
具体需求
1. 知识库整理
• 任务:对现有的对话内容进行整理,转化为结构化的 JSON 文件。
• 要求:
• 按问题(Question)和答案(Answer)对进行分类。
• 添加可选标签(Tags),便于后续优化检索。
• 确保数据格式完整、无误。
2. 矢量数据库部署
• 任务:选择并部署一个矢量数据库(如 Pinecone、Weaviate 或 Redis),用于存储知识库数据。
• 要求:
• 数据上传至数据库,并生成嵌入向量(使用 OpenAI 提供的 text-embedding-ada-002 模型)。
• 配置数据库支持快速检索,并确保系统稳定性。
• 提供访问方式和部署文档(如 API 密钥、索引名称)。
3. ChatGPT Retrieval Plugin 配置
• 任务:在 ChatGPT 企业版中配置 Retrieval Plugin,确保插件能够访问矢量数据库并正常运行。
• 要求:
• 配置数据库连接(API 密钥、索引名称等)。
• 调整检索参数(如 Top-K 值和相似度阈值),优化查询效率和准确性。
• 确保插件在多轮对话中保持上下文一致性。
4. 测试与优化
• 任务:在新对话窗口中测试插件功能,确保能够精准检索知识库内容。
• 要求:
• 模拟多轮对话,验证知识库检索效果。
• 提供详细的测试报告,描述优化点和改进建议。
交付内容
1. 整理好的知识库 JSON 文件(含分类和标签)。
2. 部署完成的矢量数据库(提供访问凭据和操作文档)。
3. 完整配置的 ChatGPT Retrieval Plugin(含参数配置说明)。
4. 测试报告与使用说明文档。
技能要求
• 熟悉 OpenAI API 和 ChatGPT 插件配置。
• 熟练掌握矢量数据库(如 Pinecone、Redis、Weaviate)的部署与管理。
• 有数据清洗与知识库整理经验。
• 能够根据需求灵活优化检索逻辑和系统性能。
项目周期
预计 7-10 天内完成。
预算范围
5,000 - 10,000 元(视经验和效率可商议)。
补充说明
• 如果您有类似项目经验,请提供案例说明。
• 本项目知识库规模较小(<500 条),主要目标是实现高效的检索功能。
• 如有其他优化建议,可在项目执行过程中沟通调整。
发布时,可根据需要修改预算和项目周期说明。如果需要进一步调整,请告诉我!