数学专业基础:插值、拟合、迭代、最优化等理论
统计基础:回归分析、方差分析、聚类分析、PCA等
算法基础:决策树、SVM、K-Means、CNN、Transformer等
技术栈:Python、SQL、C
方向:NLP、图像
项目:人脸识别、文本分类、时间序列分析、LangChain、OCR、ARIMA
工具:ComfyUI、Matlab、SPSS
1、搭建私有 AIGC:
(1)大语言模型 LangChain 思想的研究和实现。
(2)基于本地知识库,使用 FastChat 接入相关的开源大模型,实现离线私有部署知识库问答应用 FastGPT。
(3)将 vllm 模型 sqlcoder 接入 LangChain 框架,并通过 FastGPT 交互使用。
2、设计并实现大模型的调优方案和评估体系:
(1)针对信息抽取任务和分类任务,使用 Freeze 方法、Lora 方法、P-Tuning 和全量参数方法对 ChatGLM 2模型进行微调,并通过 opencompass 框架测试优化后的模型效果。