985高校,软件工程专业硕士学位,4年工作经验,主要从事算法工程师方面的工作,包括图像识别,大模型方向。
熟悉常见的图像技术,包括OCR,人脸识别,目标检测,分割等。
熟悉python语言,pytorch框架,以及redis,Kafka,flask等使用
熟悉大模型微调训练流程,以及实际落地部署,上线使用。
具有较强的编程能力,代码复现能力,
1、OCR识别比赛,在天池比赛上获得了第五名,总共有1200+支队伍
2、人脸识别以及暴恐目标检测项目,相较于迭代优化之前的算法,召回率提升20%,准确率提升30%
3、大模型微调训练,数据增强,模型落地部署,采用RAG技术,提升大模型回答能力
4、地标识别检测,色情识别,垃圾广告识别项目
OCR迭代项目,采用deep_text 模型作为基础框架进行训练,训练数据主要包括天池比赛数据集,以及常见的中文开源数据集CTW等,还有合成的数据,总共的数据量大概100万+,测试集以天池比赛的评估为准,以及评估实际的上线情况。模型迭代完成后,在天池比赛排名第5(总共1200+支
多模态对话模型,采用了14B的Qwen-VL作为基础模型,下载预训练的权重参数,对于讲解垂类领域的问答,通过两种方式来增强模型的对话能力,一种是准备微调数据集,人工筛选,经过自动化工具进行数据扩充,进行微调训练;另一种是通过RAG方式,使用垂类的文本数据作为基础数据库,先进行数据
我是主要负责人,采用了两阶段方式,第一阶段使用了分类模型,首先对所有的图片进行分类,筛选地标图片,主要是为了提升识别准确率;第二阶段,在此基础上,使用yolov8 作为基础模型,对地标进行检测识别。 整个项目,需要先收集训练数据集,通过爬虫方式爬取国内外网站的地标图片,人工简单