1.熟练掌握Python语言、JAVA语言,1年以上的Python语言应用开发经验
2.熟悉MTV架构,熟悉Django,Flask等框架,熟悉Restful API 开发思想。
3.熟悉前端网页技术,包括HTML5、CSS、JavaScript、VUE.JS等。熟悉TCP/IP 协议等。
4.了解基于Docker环境的应用开发和部署,了解Celery任务调度框架熟悉网页抓取原理及技术。
5.熟悉re、beautifulsoup、xpath、selenium、scrapy、feapder框架等网页信息抽取技术。
6.熟悉常见的反爬机制及应对策略,熟悉scrapy框架。
7.熟悉Linux平台及 Linux 常用命令的使用。
8.熟练使用MySQL关系型数据库,MongoDB非关系型数据库。
9.熟悉常用的版本管理工具,如Git。
10.具备良好的Python编码规范。
11.会使用影刀RPA、八爪鱼RPA技术等自动化技术。
有爬取股票信息、探迹、闲鱼、淘宝、京东、抖音、小红书各大平台数据。
图书管理系统
项目概述:该项目是图书管理系统,页面主体是整个网页模板的框架和前端部分;使用的是Django框架,采用Django的用户和鉴权系统,然后通过Django的用户系统完成注册和登录页面;
项目职责:
1.负责项目的需求分析
2.负责数据库模型设计
3.负责后台业务逻辑的编写与前后端交互
4.负责项目的单元测试
二手房数据采集
项目概述:本项目旨在使用 Scrapy 爬取5i5j网站的二手房和公寓楼数据,并将提取的信息存储到 MongoDB 数据库中。主要爬取的数据包括房产名称、户型、面积、户型结构、建筑类型、房屋朝向、装修情况、配备电梯、建筑结构、供暖方式、产权、购房年限、抵押情况、价格等信息。
项目职责:设计爬虫抓取逻辑并实现代码开发,对爬取的数据进行提取和清洗,使用 Scrapy 框架实现网络爬虫。
技能描述:项目采用 Python3 语言,Scrapy 框架,使用 Xpath 解析网页,使用 Referer 和 User-Agent 池处理网站的反爬机制,使用 Scrapy-Redis 分布式架构进行分布式爬取,采用 MongoDB 非关系数据库进行持久化存储。
探迹RPA自动化数据采集
项目概述:本项目的目标是利用八爪鱼RPA技术从探迹网站自动化采集外贸企业的信息数据。这些数据包括出口国家、贸易类型、公司名称、联系方式、年营业额以及企业地址等。
项目目的:是通过自动化手段减少人工操作的需求,提高数据采集的效率和精确性,并将所得数据存储于Excel文件中以便后续处理和分析。
项目职责:使用自动化进行爬取数据,理清每个逻辑并进行完善模块化开发,负责将爬取的数据进行必要的清洗、格式化处理后存储到Excel文件中,确保数据的可用性和整洁性。
技能描述:为了让企业能够快速掌握外贸企业公司的基本信息和联系方式,就采用最快速简便的脚本进行获取数据。
Python 爬取股票信息并进行可视化分析 项目概述 本项目旨在使用Python爬取实时的股票数据,通过JSON接口获取股票相关的价格、成交量等数据,并对这些数据进行可视化分析。项目的主要目标是为用户提供一个自动化的工具,可以随时获取最新的股票信息,并通过图表等方式进行数据分
使用八爪鱼RPA爬取闲鱼租房信息自动化流程 作品简介 本作品展示了如何使用八爪鱼RPA工具,实现对闲鱼平台租房信息的自动化数据抓取。通过本流程,用户可以轻松获取到闲鱼上最新的租房信息,包括租金、房源位置、房屋描述等,提升数据收集效率。 爬取步骤 确定目标网址:选择闲鱼
使用八爪鱼RPA爬取闲鱼租房信息自动化流程 作品简介 本作品展示了如何使用八爪鱼RPA工具,实现对闲鱼平台租房信息的自动化数据抓取。通过本流程,用户可以轻松获取到闲鱼上最新的租房信息,包括租金、房源位置、房屋描述等,提升数据收集效率。 爬取步骤 确定目标网址:选择闲鱼