掌握深度学习和强化学习理论知识,熟悉计算机视觉原理和数字图像分析理论基础。
掌握Tensorflow以及PyTorch深度学习框架,熟悉常用linux操作。
掌握python语言,熟悉C++语言,掌握OpenCV库,理解CUDA基本原理。
掌握深度学习目标检测以及分类任务常用网络结构,掌握调参方法,具备设计模块网络结构的能力,理解
LLM大模型基本原理及应用,掌握GAN及扩散模型等AIGC原理。
理解基于深度学习三维重建理论,掌握双目立体视觉原理并具备实践经验。
1.参与音乐生成以及AI儿童歌曲创作项目,主要工作是编写脚本构建音乐旋律数据集,微调并训练旋律语
言模型和歌曲合成模型,实现歌词生成旋律的推理过程,同时编写脚本由歌词和旋律构建乐谱生成音频。
2. 研究运用摄影测量与深度学习相关技术,设计多基高比测绘体制研究与仿真实
验,编写实验程序,根据实验结果撰写学术论文《多基高比定位精度影响因素仿真与分析》,以第一作者发
表。 独立完成深度学习多视角立体匹配算法的设计,调参优化网络结构,用于重建DSM任务,进行多组对
比实验,参数量减少42.93%,模型重建完整度上涨0.29%,根据实验结果撰写学术论文《Deep Learning-
Based DSM Reconstruction of ZY-3 Satellite Imagery》。
3.参与餐厅结算台开发项目,主要工作是运用目标检测算法对菜品检测准确识别,设计菜品匹配模型扩增数
据集, 通过强辨别力的分类模型实现对菜品的细粒度分类,精度上涨5个百分点。参与模型部署工作,在
Jetson 人工智能开发板上用 C++语言部署到生产环境,目前产品已经落地,误检率大幅降低,用户反馈良
好。