1.熟练掌握python编程语言,熟练掌握R语言,熟悉Numpy、Pandas等数据分析框架,熟悉机器学习sklearn框架,熟悉深度学习框架keras,理解面向对象编程语言的三大基本特性:封装、继承、多态。
2.熟练掌握统计模型及机器学习算法,如逻辑回归、关联分析、决策树、朴素贝叶斯分类器、K近邻、K均值聚类、Adaboost、随机森林、EM算法等。熟悉深度学习模型,如CNN(卷积神经网络)。
3.熟悉Hadoop、spark大数据框架。掌握数据库查询语言:SQL。
4.掌握SPSS等常用数据分析工具,熟悉微软Office软件Excel,PPT,Word,熟悉Excel函数,熟悉Excel数据透视表等,熟悉VBA编程语句。
5.对数据敏感,有良好的逻辑分析能力和系统性思维能力,能发现数据中的变化和问题,做事细致谨慎,具有良好的学习能力,通过英语六级,英文读写能力良好,学习能力较强,为人踏实有上进心。
1.在国美子公司安迅BI系统一期期间,为BI系统设计了一整套电商数据分析体系,为其电商运营提供了数据化指导,可以时时监控运营细节,及时调整运营策略。并为BI二期商品推荐功能提供了推荐算法,实现了基于用户和基于物品的两种推荐方案,解决了以往无法进行商品推荐的难题。
2.为大理石厂商提供了一套图片搜索算法,依靠对大理石进行拍照,将照片保存,从图片库中搜索到与目标大理石相似的大理石进行线上拼接测试,解决了长期以来大理石厂商靠人工筛选、人工搬运大理石进行拼接的难题,提供了生产效率。
3.在公司内部项目中,用机器学习算法开发了一套量化交易策略,用于期货程序化交易,解决了人在股市交易中的情绪化交易,降低了风险同时提高了收益。
4.文本挖掘方面,研究过中文文本分类问题,预测互联网新闻文本为何种类别新闻。
角色 | 职位 |
负责人 | 高级数据分析师 |
队员 | 产品经理 |
队员 | UI设计师 |
队员 | 后端工程师 |