基本信息

案例ID:219911

技术顾问:Daniel - 1年经验 - 广州臣信科技有限公司

联系沟通

微信扫码,建群沟通

项目名称:NLP

所属行业:人工智能 - 其他

->查看更多案例

案例介绍

基于LangChain框架的AI-Agent 智能系统 2024.08-2024.09
项目简述:使用Windows平台实现了基于Llama3.1的AI-Agent项目
应用知识:Python语言基础、Transformer框架、LangChain框架、向量数据库
功能概述:
1.搭建Chain流程:创建模型推理类,实现LangChain框架必要类方法
2.实现功能方法:编写网页爬取爬虫函数,编写业务所需功能函数
3.设计Tools及Prompt:设计tools的参数及功能描述,以及函数功能模板
4.测试流程:运行项目,测试项目的效果,模型顺利推理并调用tools直至完成
5.输出结果:将调用工具汇聚的字符串输入到模型中,由模型输出结果

基于ChatGLM3的智能问答的Lora微调系统 2024.06-2024.07
项目简述:使用本地电脑平台实现了ChatGLM3的智能问答模型的Lora微调,
应用知识:Python语言基础、Lora微调技术、Transformer框架
功能概述:
1.数据集获取:使用的是公司的内部数据,用于对外介绍公司和技术展示。
2.数据集的分类:读取json文件并划分为训练集、测试集和验证集。
3.模型搭建:在魔搭社区下载并导入ChatGLM3-6B模型,然后搭建模型框架。
4.循环训练模型:查看训练loss,调整配置文件,循环训练等待。
5.模型性能评估:通过交叉熵损失判断模型的拟合程度。
6.使用Streamlit框架搭建一个交互界面,经过内网穿透可用于外部使用。
项目难点:
1.遇到了loss的计算问题,后来查询诸多项目代码发现,模型的计算方式是输入的每个词的下一个词,然后错位计算loss即可!
2.遇到梯度消失和梯度爆炸的问题,查经发现梯度消失是因为学习率过大,而梯度爆炸的问题是通过调大优化器的一个位于分母的参数,保证分母不至于过小,从而解决了这个问题。
3.没有使用Peft框架,而是直接使用PyTorch框架,修改最后一个线性层,从而实现Lora微调。
4.模型的Windows和Linux系统的部署。

相似案例推荐

其他人才的相似案例推荐

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服