通过大数据分析技术,分析现有存量数据,针对以下四个方面对用户睡眠数据进行分析:
1、基础数据整理
使用PySpark程序对原始数据进行解析、清洗、加密。脏数据处理,如:很多用户基本信息没有填写。
2、针对用户
多维度、细致化分析每个用户一段时间内睡眠质量变化情况,根据用户基本信息,如年龄、性别、身高、体重等,结合用户睡眠详情分析并展示结果,如统计各年龄段睡眠数据分布、统计不同体型用户睡眠数据分布以及统计各年龄段睡眠数据分布和性别的关系。
3、针对特殊用户
根据睡眠报告中各指标的差异,筛选特殊用户数据,并为该用户附上专属标签。特殊用户指:使用产品后,出现多次晚睡,多次晚起,多次睡眠不足,深睡时长短等影响睡眠质量的用户,以及睡眠数据波动量较大的部分用户。
4、针对用户反馈
结合用户反馈表中所有信息,分析各条件下反馈类型频次分布,如各用户反馈详情统计,每月用户反馈详情统计以及各反馈类型详情统计。