语言:精通java、c#,熟悉Python、rust
熟悉常见主流框架,新东西上手速度快
中间件:熟悉redis、rabbitMQ、tomcat
数据库:mysql、sqlserver、oracle、neo4j
其他技术:具有音视频相关技术实践,word、pdf、excel文档等解析识别,爬虫框架scrapy,加解密算法
目前负责公司产品的架构设计,解决项目疑难问题、性能调优,调研前沿新技术
担任过多个省中心和央企项目的招投标平台开发负责人,如中石化物资采购平台、中国神华招标网
有丰富的架构设计经验和代码编写能力,开发经验充足、解决问题熟练、沟通能力良好
技术选型: 爬虫框架:Scrapy 开发爬虫项目,具备多线程、分布式能力 爬虫部署容器:Scrapyd 爬虫发布运行的容器,运行爬虫、远程控制、队列数据 爬虫可视化管理服务:Gerapy、ScrapydWe
pdf是版式文件,基于坐标存储字符,正文是按“字+坐标”单元存放,常用工具提取出的内容只能做到按行组合,不符合真实阅读的“段落”的数据要求,本工具通过特定算法可将pdf正文按段落输出;表格文字同样可根据线条分割组成完整的一个表格格式数据输出;输出结果包括 文字+pdf坐标区域。