• 编程语言熟悉C++和python
• 了解经典统计学习算法、深度学习原理;具有计算机视觉相关、多模态大模型相关的项目实践、参数调优经验,熟悉pytorch框架,接触mindspore框架
• 计算机基础课:数据结构和计算机组成原理;操作系统
数学基础课:概率论、微积分、线性代数
基于Unet的遥感图像语义分割项目
2023.03-2023.06 个人完成
• 识别北京全域的城中村分布。分析并拆解问题,制作数据集,调优Unet训练,得到城中村分布
• 使用ArcGIS Pro处理tiff文件、标注,转化为合适格式,切分为合适的分块输入基于pytorch的代码训练,结果拼接回原尺寸并在GIS中可视化处理
• 使用ArcGIS结合POI数据分析结果,聚类分析、对比分析并可视化
北京某公司 计算机视觉实习生
2022.08 – 2022.12
• 视频实时目标检测任务,识别车间环境下的各类维修工具。针对存在小目标和遮挡情况选 择yolo-v5模型。使用copy-paste的方法提高小目标比重,保持样本均衡。
• 基于yolo内置算法和Albumentations库试验多种数据增强方式。试验视频抽帧和静态拍照等 数据采集方式。试验yolo-v5s和yolo-v5m的性能差异。辅助开发同事用C++部署模型,使用 cvmart开源代码,推理速度达到200+FPS
• 其他适合该业务场景的领域调研:视频动作识别、时序动作定位的核心论文阅读、算法调研,撰写相关文档
华为多模态大模型项目
2022.03 - 2022.06 与另一位大三同学合作,编程语言:python
• 项目基于校企合作课程,学习算法原理,复现大模型预训练过程,完成两个预设的下游任 务:图像到文本生成、VQA
• 理解大模型源码,理解图像、文本、语音三类数据的处理过程。通过加入新数据集提升图 像到文本生成子任务性能。
智慧城市专业创新实践课程
2021.09 - 2021.12 选修课程,与一名大三同学合作完成,编程语言:python
• 创新实践课程,进行基于多源数据的暴雨情景下人群时空行为模式研究
• 完成问卷数据、监控视频数据、知乎网页端文本数据的采集与分析,综合提出对城市设计 的建议
• 运用spss对问卷数据进行统计分析。运用基于yolo-v5的目标检测模型,对视频数据进行处 理。用微词云工具进行词频统计和词云生成。借助python数据分析进行进一步处理和数据 可视化。
基于Unet的遥感图像语义分割项目 2023.03-2023.06 个人完成 • 识别北京全域的城中村分布。分析并拆解问题,制作数据集,调优Unet训练,得到城中村分布 • 使用ArcGIS Pro处理tiff文件、标注,转化为合适格式,切分为合适的分块输入基于pytorc
三维网格缩边程序 语言:c++, 编程环境:Visual Studio 读入obj格式文件,转化为半边结构,使用论文中的网格曲面简化算法,通过连续缩边,将三维网格简化到固定面片数输出。优化数据结构降低时间复杂度。