爬虫:熟悉网页抓取原理及解析技术,了解基于cookie的登陆原理。熟悉Re,Xpath等网页的抽取技术,熟悉常用的反爬虫策略,熟
悉scrapy,熟悉各种反爬虫策略及解决办法, 熟悉APP信息的抓取。
数据库:熟悉mysql数据库,熟练使用sql语句,掌握mongodb,redis等非关系性数据库。熟悉大型非关系型数据库pika的使用,
熟悉elasticsearch数据库,熟悉clickhouse列式数据库。
Linux:熟悉linux平台开发,熟练使用常用的linux命令和shell编程,项目实现自动化。能够独立开发项目,有独立开发经验,熟悉
应用部署流程,有良好的编码风格。
后端Web框架:熟悉fastapi、flask、tornado等框架。
前端框架:Vue、React.
项目名称:AI数据交付系统(个人开发)
应用技术:
1. fastapi + pony orm设计后端接口
2. celery实现异步任务调度
3. vue呈现前端页面实现前后端分离
项目职责:
1.负责后台fastapi接口设计与开发
2.负责前端vue程序的设计与开发
3.负责实现后台异步或定时任务的设计与开发
4. 负责后台数据的整理与统计
5.负责项目测试与优化
1.负责整体框架中的下载器的编写 2.参与整体框架的设计 3.负责下载配置数据库的设计 4.负责监控数据的进程 5.负责mongo的搭建和读写分离配置 6.负责pika主从搭建,及读写分离
项目名称:大量APP数据的抓取 应用技术: 1. redis实现任务的调度 2. 2.mysql数据的存储和表的设计 3. 使用fiddler试探app端的接口,使用postman工具模拟请求。 4.使用shell项目的自动化 项目职责: 1. 负责部分APP接口的