帮助某985高校课题组设计自动特征工程模块,主要实现对录入的实验数据先经由数据预处理操作如:噪声消除,空值填补,空值大于50%的字段转为指示变量,xgboost空值填补。再对数据经由统计检定及随机森林筛选删除不相关变量与冗余变量。最终得到特征矩阵用于实验室后续实验。
在科创夏令营期间,运用爬虫与文本挖掘的技术帮助团队挖掘洗碗机相关产品机会点,评论提取情感分析,协助团队进行方案决策。设计推荐系统,寻找客户的产品倾向,同时担任团队专利工程师,进行专利挖掘等工作。
帮助某浙江电网实习生运用关联规则与序列模式通过数据库认识各种模式之间的关系与发生先后的可能性。
协助某研究生态系统服务的博士实现因子相关性分析,因子聚类并探究个因子对聚类类别的特征重要性排名,并提供可视化。