熟悉python全栈开发,熟悉爬虫开发,熟悉数据分析,熟悉大数据hadoop hive spark flink flume kafka等开发,熟悉java全栈ssh框架开发,熟悉mysql等常用数据库,熟悉报表制作,自我学习能力强,乐于学习新的技术
1,某网站数据爬取,js反爬,解密,数据清洗,数据入库到数据库,表创建。2,大数据开发环境搭建,hive脚本开发优化,性能调优。3运用datax,编写python脚本做数据清理传输。
负责编写车站代码,通过selenium实现自动登录,选择车票,自动占座抢票,本项目用python代码进行实现。
通过多线程队列的方式获取代理ip,用redis保存可以的代理ip,本项目使用的是python语言实现抓取。
通过js逆向实现解OB混淆反爬虫网站考古加,通过json、mysql、mongodb等方式实现数据存储,本项目用python进行实现。