1. 熟悉Python编程语言,了解面向对象设计。
2. 熟悉前后端分离开发,掌握Flask、FastAPI等基于Python的WEB框架。
3. 熟悉SQL语句,熟练使用关系型数据库MySQL,了解数据库基本原理。
4. 熟悉基于Python的网络数据采集,有使用response,selenium,beautifulsoup等第三方库的经验,熟悉常见的反爬策略及其破解方案。
5. 熟悉基于Python的自动化办公,使用Python程序实现Excel,Word,PDF等文档的批量处理。
6. 熟练运用Numpy、pandas对数据进行重塑、清洗、治理、透视,并分析洞察数据。
7. 熟悉使用Power BI、Matplotlib等可视化工具。
电商平台用户RFM分析:
为了提高平台业绩,优化资源分配,对广告进行合理投放,对用户最近一次消费、消费频次、消费金额等特征信息进行分析。根据业务要求使用jupyter结合numpy、pandas对数据进行提取,对空值、异常值,重复值处理。利用Python可视化工具展示用户回购率、复购率、留存率等指标,观察分析出用户的行为。利用RFM模型分析用户的价值度,对用户划分不同的等级,根据用户等级进行相应的精细化管理和维护。
用户评分机制构建:
为平台构建用户评分机制,对用户的行为进行量化,通过用户各项指标,换算出用户的分值,进而对用户赋予相应的权限。使用Python对数据探索清洗,运用决策树对变量分箱操作,获取IV值和WOV值,得到最终特征矩阵,筛选指标并运用逻辑回归进行学习建模,使用准确率和ROC曲线验证模型的预测能力,最终将逻辑回归转换成标准评分机制。