熟练使用MySQL进行增删改查
熟悉使用SmartBI制作数据报表及数据分析
了解NumPy和Pandas进行数据的清洗和数据的预处理,以及使用Matplotlib进行数据可视化
了解Linux安装与配置, 了解Storm实时开发(zookeeper、storm安装与集群搭建) 了解Hadoop(MapReduce工作原理、分布式文件系统、Hive数据仓库工具、开源数据库HBase)
熟悉使用Axure RP、Adobe XD等工具进行流程及原型设计
熟悉撰写PRD;熟悉内容运营,了解软件测试,包括撰写测试用例及测试反馈
基于协同过滤算法的图书推荐系统
通过爬虫爬取部分图书信息数据,搭建并将数据写入数据库,基于Spark集群环境,通过Spark Streaming读取Kafka消费的数据达到实时推荐的效果;利用协同过滤算法完成离线推荐,并将推荐结果存入数据库,通过Spring Boot+MySQL将推荐数据在前端页面展示出来。