1. Java 能够熟练的使用Java进行相关开发工作,目前从事Java开发工作已经2年多。
2. python 熟练掌握python,以及相关开发工具。曾经使用python进行爬虫,机器学习等学习研究。
3. Linux 熟悉linux环境,能够在Linux环境上部署代码。
1.通过搜狗微信平台,利用爬虫技术获取特定微信公众号发布的微信信息,记录并保存。通过模拟浏览器,添加cookie的方式来避
开反爬虫措施。
主要工作:
(1).通过代码访问搜狗微信平台获取网页源码信息
(2).模拟浏览器,限制访问频次及添加cookie来应对反爬虫措施
(3).解析页面信息,将所需信息保存
2.根据现实商场采集的顾客手机WiFi数据来分析顾客在商场内的停留、移动等行为习惯。从数据清洗,到最终的结果展示,能够较
为准确的分析出了顾客在商场内停留时间较长的区域,发现游逛热点。
主要工作:
(1).原始数据的清洗及预处理
(2.)对缺失数据的差值补全
(3).基于密度聚类得到热点