会python爬虫,大数据分析,了解前端得结构和代码,学习过c++,Java,有良好得代码阅读能力,不能包含用户的个人信息、隐私或者他人的商业秘密不能侵犯作者的著作权等其他受法律法规保护的内容严格遵守网站设置的robots协议,必须禁止"侵入”严禁通过“隐瞒事实、虚构真相”的方式对数据进行访问在规避反爬虫措施的同时,避免干扰被访问网站的正常运行获取的数据不能替代数据来源方的原服务。在如今的大数据时代,得数据者得天下的说法是毫不夸张的,现在的社会中,无处不充斥着数据的身影,各行各业中,数据都占据着及其重要的地位,这也就意味着,我们能爬取到的数据只能是人家允许我们看到的,如果人家不给我们看,即设置了一些阻碍去禁止我们爬取的时候,千万不要为了显示自己的能耐而去攻击人家,这是违法的。现在的数据已成为重要的生产要素与核心资源。
python爬虫做过贝壳网得爬取,多页跳转都会,登录得网页也会但是时间要很长,因为经验少。大数据分析做过上千得数据分析,预测,pandas, numpy熟悉
一个是做的爬取成都租房得详细数据,里面得网页跳转,数据保存都是我负责,第二个是豆瓣电影得链接和基本类容获取,我负责数据获取
豆瓣网上得数据爬取,爬取豆瓣上的电影链接,导演,介绍,等主要负责的是数据爬取,数据保存,获取豆瓣网上得所有数据