常用编程:Python
学历:数据科学+计算机科学双硕士
技能:
1. 目标检测/分类;
2. 大语言模型预训练/微调/垂域应用(QA, RAG等)
3. 文档解析(布局分析,OCR等)
4. 数据清洗和合成
1. 全结构化检测(交通路口安防相关项目)
2. 大语言模型预训练
3. 大语言模型工具链搭建
4. RAG文档问答系统搭建
5. 文档解析(布局+OCR)
pdf布局解析,此图为从pdf源码中直接解析获得粗糙的布局框,使用的开源的python包,所以可以展示
大语言模型预训练项目,图中为用gradio编写用来收集RLHF对齐人类偏好微调数据的界面,使用者基于当前模型的回答和teacher模型的回答来投票