熟悉Java,Python
熟练使用Linux, windows, VMware workstation
熟练使用Ipython,Eclipse
熟练使用scikit-learn,pandas,matplotlib
熟悉机器学习算法(Linear Regression,Logistic Regression,K-means,Decision Tree等),SQL语言
2015/03—2015/04 阿里移动推荐算法大赛
项目介绍:以阿里巴巴移动电商平台的真实用户-商品行为数据为基础,提供了10000名用户在一个月时间(11.18~12.18)之内的移动端行为数据,预测这些用户在这个一个月之后的一天(12.19)的购买数据。
涉及技术: 1. 用Pandas进行数据分析 2. 数据可视化使用matplotlib 3. 算法方面使用的scikit-learn
个人职责:(1)进行数据清洗。(2)特征工程。(3)模型选择。(4)训练模型进行预测。
2015/09—2015/11 数据挖掘项目:集团专车驾驶行为分析 天盈建科技有限公司 | 研发部 | 数据挖掘工程师
项目介绍:对驾驶人驾驶过程中由MOBILEYE车祸预防系统产生的大量告警进行数据分析,把不同的驾驶人员聚类,分析每一类驾驶人驾驶行为上出现的共同特征,生成报告,提供给集团管理人员。
涉及技术: 1. 使用Tableau对原始数据进行可视化分析 2. 在Ubuntu操作系统下,使用Python进行数据预处理,开发工具是ipython 3. 用Pandas进行数据分析 4. 算法方面使用的模块是scikit-learn进行聚类分析 5. 分析结果的数据可视化使用matplotlib
个人职责:(1)进行驾驶行为的研究。 (2)负责对MOBILEYE车祸预防系统记录的驾驶人驾驶行为数据进行数据预处理。(3)负责分析驾驶人的共同特征,有助于集团对驾驶人进行统一的管理和培训。 项目总结:实现对驾驶人驾驶行为的分析及可视化。