熟悉深度学习,计算机视觉,机器学习方向,熟悉Pytorch、Tensorflow等深度学习框架,熟悉CNN,transformer系列模型,熟悉计算机视觉任务,如检测分类分割等,具有django,html,css,js,sql全栈网页项目开发经验,熟悉linux、git、docker等。曾获得国家科技竞赛一等奖两项,创新创业奖一项,优秀奖两项,发表科研论文5篇。
人脸检测与识别
通过yolov7检测到人脸框,裁剪出人脸框范围进行仿射变换,之后使用mobilefacenet进行特征提取获得人脸特征向量,与数据库中人脸特征向量进行相似度对比得出人脸身份,识别准确率超过99%。基于django,html,css,js,sql开发了前后端及数据库,支持http和websocket。
基于面部视频的生命体征检测
目标:通过视频获取测试者的远程光电体积描记术信号(RPPG),使用该信号计算心率值。方法:1)预处理:人脸检测对齐,图像裁剪缩放,滑窗采样。2)使用基于注意力机制的卷积神经网络进行图像特征提取。3)将提取特征和背景特征输入LSTM实现面部视频至RPPG信号的映射。4)从RPPG信号中使用带通滤波和傅里叶变换计算心率。
结果:在COHFACE数据集上实现了心率检测,模型表现:MAE=0.82,r=0.96。
无标记细胞图像虚拟染色算法
目标:通过细胞显微镜明场图像预测亚结构荧光染色图像。方法:1)构建数据库:使用医院新鲜肺癌组织消化得到单细胞悬浮液,对悬浮细胞进行DAPI细胞核染色,使用共聚焦显微镜拍摄三维细胞层扫图像,得到自建肺癌数据库。此外我们同时使用了开源数据库进行算法验证。 2)图像预处理:尺寸变换、图像标准化、随机裁剪分块 3)搭建融合注意力机制的密集连接卷积神经网络实现细胞明场图像预测细胞荧光图像。4)模型评估,优化模型结构和参数。
结果:模型在开源数据库上实现了SOTA效果,在自建肺癌数据库上模型能较准确预测出细胞核荧光染色结果,r=0.77,MSE=0.08,PSNR=22.98,SSIM=0.42。
医院ICU电子病历数据挖掘
目标:通过回顾性电子病历数据对患者未来24小时血清钠状态进行预测。方法:1)数据预处理和数据探索性分析。2)基于统计学方法和LASSO回归模型进行特征选择。3)分别建立机器学习三分类模型(逻辑回归、SVM、随机森林、XGBoost)和回归模型(线性回归、随机森林、XGBoost)。4)模型可解释性分析。
结果:实现了患者24h后血清钠预测,分类模型准确率、精度、召回率、F1值均约为0.86,回归模型MAE=2.1。
森林公园鸟类计数
目标:计算公园摄像头拍摄图像中鸟类数量。方法:使用MXNet框架搭建带反卷积的ResNet18网络训练模型得到目标密度图,使用最大池化结合与运算得到单连通区域,所得单连通区域个数即为鸟类数目。
结果:训练得到的鸟类计数模型MAE=1.35,并进行了模型封装和docker镜像部署。