在大数据领域及软件开发科技服务内容方面自工作以来,先后在国内专业技术论坛——CSDN技术论坛发布技术研究类博客达43篇,博客累计访问量达189347次、累计粉丝人数108人、国内博客排行榜排名43567位,在全球技术开源代码平台累计发布开源代码24次,其中2020年开源的两个代码库被“全球北极代码库贡献者”仓库收录,在数图行工作期间在自动化办公协同及数据采集方面,先后个人独自获得《网络数据自动采集平台》、《商机采集管理信息系统》两项软件著作权,参与项目获得《数据访问调查及分析系统》、《人力资源管理信息系统》两项软件著作权。具有丰富的大数据处理分析经验,熟练掌握并使用基础大数据组件,并能发掘数据关联规律,发掘潜在价值,实现企业数据最大化利用,稳固企业数字化生态布局。
个人工作技能方面熟练使用 Webmagic、Scrapy、Request-html、Selenium、Puppeteer 等爬虫框架,熟练使用数据清洗工具kettle,熟练使用 Flask 框架、简单使用 springBoot 对数据接口进行开发,对于数据分析使用 Pandas 进行分析并通过 Echarts、FineBI BI、Davinci 进行图表绘制及数据展示,熟练使用 Fiddler 对网页、手机 APP、微信小程序等接口进行破解抓包,使用 kettle 进行数据清洗作业开发。掌握并使用 Linux 服务器进行作业集群部署与调度,使用基于 redis 的 redisGraph 图数据库对热点数据进行图查询展示,对大数据框架 Hadoop,spark,等有所了解并可使用 python API 进行简易作业开发,并能使用 python 版本 mrjob,dpark等进行作业调度开发。