精通Java,C/C++编程语言,数据结构,Mysql数据库
熟悉Linux操作系统,web服务器开发,spring,mybatis,git,svn,maven,redis,dubbo
了解tomcat,nginx,html,jsp,shell script,jvm虚拟机
研究过spring ioc项目源码
熟悉python语言,熟悉网络爬虫
熟悉小程序开发
项目一:基于scrapy框架的和讯人物爬虫抽取
使用scrapy框架爬取和讯人物的页面信息,定义抽取新的需要爬取的URL规则,抽取核心信息
项目二:导入工具的开发
根据百度百科词条的url,抓取百度词条的html源码,抽取出摘要,基本信息,正文,图片图册信息,将图片图册下载并上传至公司服务器,并替换原文地址,导入公司词条库
项目三: 订单表的水平拆分
订单邮件老表数据量太大,查询效率低,迁移困难。通过对订单邮件表的按月水平拆分,存储和搜索邮件时根据下单日期动态构建表名,实现对订单邮件查询响应时间降低高达80%。并且历史数据按月迁移更加快捷方便。此外,通过定时Task实现对当前月份的下个月份邮件表是否存在的监控和提前报警,以便于技术人员及时创建新的月份表。