具备数据分析、爬虫的相关技术。熟练掌握Python的Numpy、Pandas、matplotlib、Sklearn模块,可以做数据分析、可视化、建模;
可以运用PlowerBI或tableau做数据可视化;
同时掌握python多线程爬虫,熟悉Selenium和xpath、正则表达式。
一、该项目使用python语言;
二、软件使用的模块:
a.利用pandas进行数据处理;
b.利用matplotlib进行数据可视化;
c.利用sklearn进行数据挖掘实现回归和分类任务。
三、项目内容:
a.对客户数据进行分类建伯努利贝叶斯模型,预测客户续费情况,为客户续存率制定KPI;
b.对公司业务数据进行相关性、回归建模分析,为各部分营收指定KPI;
c.对公司用户评价,尽情文本分类和情感倾向分析。
1/ 电商评论数据文本情感分析,利用SnowNLP和jieba分词器对文本进行处理,利用wordcloud进行词云可视化词; 2/ 电商RFM模型,用户价值分类;
采集学生是否主动报班、学生测试成绩、家庭收入状况数据,对学生做续班分类。 利用贝叶斯分类模型,对客户续费结果做模型预测。