ID:353934

Daniel

初级NLP大模型开发工程师

  • 公司信息:
  • 广州臣信科技有限公司
  • 工作经验:
  • 1年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 所在区域:
  • 广州
  • 白云

技术能力

1、熟练掌握C指针、数组、函数的使用
2、熟悉Python中常见的数据类型包括整数、浮点数、字符串、列表、元组、字典的使用
3、熟悉Opencv中的很多函数进行图像处理,包括图像滤波、形态学操作、边缘检测、图像分割等
4、熟练掌握图像处理算法,包括图像分割、目标检测、图像识别等
5、了解掌握Python语言进行图像的图像滤波、形态学操作、边缘检测、图像分割,图像匹配等基本处理操作
6、熟悉TensorFlow、PyTorch等深度学习框架、了解OCR技术
7、熟练使用以及微调各种大模型,如ChatGLM3,BERT,了解大模型的本地部署。
8、熟悉Lora微调,熟悉LangChain,了解Prompt微调以及本地部署大模型。

项目经验

基于LangChain框架的AI-Agent 智能系统 2024.08-2024.09
项目简述:使用Windows平台实现了基于Llama3.1的AI-Agent项目
应用知识:Python语言基础、Transformer框架、LangChain框架、向量数据库
功能概述:
1.搭建Chain流程:创建模型推理类,实现LangChain框架必要类方法
2.实现功能方法:编写网页爬取爬虫函数,编写业务所需功能函数
3.设计Tools及Prompt:设计tools的参数及功能描述,以及函数功能模板
4.测试流程:运行项目,测试项目的效果,模型顺利推理并调用tools直至完成
5.输出结果:将调用工具汇聚的字符串输入到模型中,由模型输出结果

基于本地部署Llama3.1的微信机器人回复系统 2024.07-2024.08
项目简述:使用Windows平台实现了已登录微信的聊天框自动点击、读取及回复
应用知识:Python语言基础、Transformer框架、WeChat第三方框架
功能概述:
1.查看官方文档:查看Llama3.1的官方文档,熟悉官方代码实现。
2.编写generate函数:实现流式输出(虽然用不上)。
3.将模型与框架结合:导入类并对接Wechat框架。
4.测试效果:运行项目并对机器人进行测试,群聊和私人聊过都不错。
5.可以给模型添加向量知识库进步提升模型垂直领域能力。

基于ChatGLM3的智能问答的Lora微调系统 2024.06-2024.07
项目简述:使用本地电脑平台实现了ChatGLM3的智能问答模型的Lora微调,
应用知识:Python语言基础、Lora微调技术、Transformer框架
功能概述:
1.数据集获取:使用的是公司的内部数据,用于对外介绍公司和技术展示。
2.数据集的分类:读取json文件并划分为训练集、测试集和验证集。
3.模型搭建:在魔搭社区下载并导入ChatGLM3-6B模型,然后搭建模型框架。
4.循环训练模型:查看训练loss,调整配置文件,循环训练等待。
5.模型性能评估:通过交叉熵损失判断模型的拟合程度。
6.使用Streamlit框架搭建一个交互界面,经过内网穿透可用于外部使用。
项目难点:
1.遇到了loss的计算问题,后来查询诸多项目代码发现,模型的计算方式是输入的每个词的下一个词,然后错位计算loss即可!
2.遇到梯度消失和梯度爆炸的问题,查经发现梯度消失是因为学习率过大,而梯度爆炸的问题是通过调大优化器的一个位于分母的参数,保证分母不至于过小,从而解决了这个问题。
3.没有使用Peft框架,而是直接使用PyTorch框架,修改最后一个线性层,从而实现Lora微调。
4.模型的Windows和Linux系统的部署。

基于Bert框架微调的情感分类模型 2024.01-2024.02
项目简述:在本地电脑上通过Transformer深度学习框架微调的好中坏评价的情感三分类模型
应用知识:Bert模型框架、增加全连接层、Transformer框架、线代基础、概率论基础
功能概述:
1.数据集获取:通过爬虫爬取各大平台合作商家内部评论并存入数据库中。
2.数据过滤并分类:将数据在数据类中读取并清晰,然后划分为训练集和测试集。
3.模型搭建:在魔搭社区下载并导入Bert-base模型,然后搭建模型框架。
4.循环训练模型:查看训练损失和准确率,调整配置初始超参数,循环训练等待。
5.模型性能评估:由于模型比较简单,只用了准确率评估模型。

基于Yolo v5的车牌识别系统 2023.10-2023.11
项目简述:使用Pycharm平台,基于Pytorch深度学习架构,实现了一个对黄绿蓝牌车牌的识别与显示
应用知识:Python语言基础、机器学习、深度学习、YOLOv5模型的实现原理、pyqt5界面设计、数字图像处理基础知识
功能概述:
1.数据集获取与分类:网上下载CCPD和CRPD数据集,并划分训练集与验证集。
2.数据标注:利用labelimg软件对数据进行标注,产生txt文件。
3.数据增强:Mosaic数据增强方法,将四个原始数据进行反转,色域变换,平移等操作,形成一个新的数据,以提高模型的泛化能力。
4.目标检测与车牌定位:模型使用了自适应锚框计算,自适应图片缩放,Focus切片,NMS非极大值抑制等操作对车牌进行检测和定位。
5.循环训练模型:查看训练指数,调整配置文件,循环训练等待。
6

案例展示

  • NLP

    NLP

    基于LangChain框架的AI-Agent 智能系统 2024.08-2024.09 项目简述:使用Windows平台实现了基于Llama3.1的AI-Agent项目 应用知识:Python语言基础、Transformer框架、LangCh

  • NLP&图像处理

    NLP&图像处理

    基于Bert框架微调的情感分类模型 2024.01-2024.02 项目简述:在本地电脑上通过Transformer深度学习框架微调的好中坏评价的情感三分类模型 应用知识:Bert模型框架、增加全连接层、Transformer框架、线代基础、概率论基础 功能概

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服