具备良好的 Python 编程技能,熟悉使用 pandas 处理和分析数据,能够运用matplotlib 、 pyecharts进行有效的数据可视化呈现,熟悉 numpy 的科学计算功能。
熟悉MySql,熟练使用Datagrip能编写较复杂的SQL,根据 SQL 执行计划和性能,对 SQL 语句调优,加快运行速度;
熟悉 Python 爬虫技术,熟练运用BeautifulSoup 库和 xpath 库进行网页数据的抓取和解析。对 scrapy 框架有一定的了解和初步的应用经验;
熟练使用BI工具Power BI Desktop、Tableau;
熟悉机器学习各种算法;如算法(决策树、支持向量机、随机森林等)
熟悉深度学习算法;如卷积神经网络、目标检测技术等;
熟悉Linux基本指令;能够高效地使用命令行界面进行日常管理和维护工作。
熟练使用office全家桶;如使用Excel复杂函数构建自动化报表等
商业银行理财产品分析
采集数据:通过Python代码,采集工商、光大等几家银行经营情况数据。
数据清洗:整理采集到的数据,通过Excel以及Pandas函数对数据进行去除异常值、优化数据结构等操作,便于数据入库。
制作报表:用SQL从数据库中提取数据,生成Excel表格到本地,灵活使用Excel表格制作自动化报表。
制作看板:里哟个Tableau连接多个Excel表格作为数据源,利用数据源制作用户画像分析、漏斗图、饼图等,来直观展示数据分析结果。
预测用户流失:运用机器学习中的随机森林算法,构建预测用户流失情况模型,并进行训练,实现根据用户购买情况来预测用户是否流失,准确率为94%以上。
数据分析:通过制作的Excel报表、BI看板、预测用户流失模型,对数据进行分析,撰写分析报告。