熟练Python数据挖掘、机器学习、深度学习;具备跨领域项目经验,包括生物统计和金融数据分析;熟练Excel、Word、PPT等办公软件;掌握R、MATLAB、MySQL、Power BI等数据分析工具
一、联合检测炎症指标对不同病原菌血流感染的诊断价值
1. 项目描述:探讨血常规数据对革兰阳性(G+)细菌、革兰阴性(G-)细菌及真菌所致血流感染的诊断价值,实现不同菌类别与菌种
的精准预判。
2. 技术栈:Python(Scikit-learn)、GridsearchCV、RandomForest、SMOTE、TPE调参
3. 项目职责:数据处理、特征工程(患者科室等)、ML算法编程、参数调优,论文撰写与修改
二、微生物组批次效应检测
1. 项目描述:处理不同Cohort人群与结直肠癌患者(CRC)肠道微生物数据,多种降维方法进行可视化,检测Batch effect并消
除。
2. 技术栈:Python、降维可视化(PCA、UMAP)、ComBat消除批次效应
3. 项目职责:组学数据处理、特征工程、降维、聚类、参数调优、论文撰写
三、基于EEGNet的PTSD风险预测模型
1. 项目描述:基于小样本EEG时序数据,结合人口特征对多模态数据建模,通过计算PCL分数对消防救援人员患PTSD风险进行评
估,并早期筛查。
2. 技术栈:Python、Multimodel、大网络模型(EEGNet、CNN)、Regression
3. 项目职责:EEG信号清洗,EEGNet构建与提取时序特征,分析特征贡献方向(危险因素与否),回归分析,撰写论文
四、基于核磁共振影像的大脑时钟模型
1. 项目描述:基于UK Biobank数据库的核磁共振影像(MRI)数据,建立多个预测大脑年龄的模型,探索与慢性疼痛、神经退行性疾病的关系(进行中)
2. 技术栈:Python、LassoCV、ElasticnetCV、MVPA SVM、DNN
3. 项目职责:数据清洗、特征工程、回归算法编程、参数调优、流行病学分析
批次效应的是由于样品处理、测序平台、实验时间或实验人员等非生物学因素的差异,导致的系统性偏差,由于批次效应的存在,数据解释变得更加复杂,需要额外的校正和验证步骤。本作品通过多方面可视化来检验批次效应,同时借鉴单细胞数据批次效应处理方法来进行矫正,以减小或去除批次效应,从而提高数据
负责角色: 负责人、一作、队长(比赛) 职责: EEG信号清洗,EEGNet构建与提取时序特征,分析特征贡献方向(危险因素与否),回归分析,撰写论文 背景: 创伤后应激障碍(PTSD)是救援人员最常见的心理问题之一,其患