熟悉 python,shell 编程,了解javaSE,springMVC
熟悉 HTTP/HTTPS 协议,TCP/IP ,socket
掌握 Scrapy 框架,scrapy-redis
熟悉 Django,Flask 框架
熟练使用 MySQL,MongoDB, Redis
熟悉 Linux 命令及平台搭建等,docker 开发环境,Git 版本控制工具
熟悉 Hadoop,zookeeper,Spark 大数据生态,熟悉 kettle 工具的使用
使用过 Elasticsearch,Logstash,Kibana,pandas,matplotlib
了解前端 js,VUE,Tensorflow 神经网络
警用系统
使用 django 框架开发后端 MySQL 作为数据存储,redis 缓存服务,celery 作为异步任务,fastDFS,Elasticsearch,
Logstash。
主要负责:
参与架构的设计,数据模型,api 接口设计。
用户注册登陆系统使用 celery 发送短信,查看和搜索(使用 Logstash 将数据从 mysql 同步到 Elasticsearch 便于搜索)商品列表,
使用 redis 缓存处理短信验证码、购物车和浏览记录等。
这个项目是对新浪,勝讯等网站分类新闻资讯吧取的分布式实现。 1.采用 scrapy-redis 分布式框架实现爬虫集群,分布式使用 Redis 实现 2.存储 Request 请求和指纹集合,并目对各个 Slave 实现集中管理和控制 3.利用 Redis 的高并发读写来实
项目描述:爬取各个大型图书网站,如新华书店图书网,在线网上图书一号店等。获取它们图书的名称,简介,购买量,评 论量,评论数据,价格等,存入数据库。 项目技能:requests,Xpath,json,Redis,MongoDB ,协程,re 项目职责: 1.使用 reque