精通Python编程语言;精通网页抓取原理及技术,熟练使用正则表达式、css path、xpath等,能够从结构化的和非结构化的数据中获取信息;精通任意一种开源爬虫框架,如scrapy、Abot、DotnetSpider等等,有开发分布式爬虫系统经验;能独立解决爬虫过程中碰到的代理中间人嗅探修改、APP反编译、算法寻找还原、验证码识别、IP切换、自动化测试工具使用的优先;热爱技术,喜欢钻研,有分享精神,注重代码质量,工作认真细致,主动性强,执行力强,抗压能力强,有良好的协作意识;
tb,jd,bd_cloud,huawei_cloud,twitter...国内外大型网站均做过爬虫
可做用户信息获取(下jd为例)
1)用户信息(用户名,id,头像,等级,手机号);
2)订单信息(订单id,商品id,订单状态,时间,价格,商品,快递单号,收件地址,收件人,收件电话);
3)地址信息(姓名,地址,手机号,地址id);
4)银行卡信息(银行名称,银行卡后四位,手机号后四位,卡类型);