python进行数据分析(pandas/matplotlib/numpy/scipy)、爬虫(request/xpath/BeautifulSoulp/scrapy),机器学习(sklearn);spss数据探索描述;R语言利用ggplot2绘图;数据库:sql
1.《佛山-不限量套餐潜客识别模型优化》:随着用户对流量需求不断增长,友商流量类套餐竞争,需要挖掘不限量套餐不同档位的潜在用户。基于用户特征、终端特征、业务办理、通行行为、上网行为、充值消费特征以及交往圈特征七个方面的指标,利用决策树构建不限量套餐潜客识别模型,实现不限量套餐不同档位的潜在用户的挖掘;同时通过ARPU增收减收算法,实现用户办理后的ARPU值的增收减收情况的预测。
2.《汕尾市健康素养及烟草监测调研》:此项目是2018年在广东省汕尾市进行的居民健康素养即烟草监测调查。主要是针对18-65岁居民进行健康素养调查和18岁以上居民进行控烟调查,从而获取汕尾市居民的健康素养和烟草流行的现状,为后续的健康素养促进工作提供科学依据。我主要负责利用Epidata两个数据库(健康素养、烟草流行)建立,组织安排学生在epidata上进行数据双录入,然后负责数据的清洗,数据分析,以及报告的撰写。