有丰富的前段开发经验和php的后台开发经验,并有与人协作大项目的经历,一般的项目都可以开发。同时研究生阶段是从事机器学习和数据挖掘方面的研究和论文的撰写,因此这方面的工作也可以胜任,例如模型的求解和模型编码的实现。包括熟练运用 python 进行各种数据的分析和处理,爬出的实现,能够用 Sklearn 实现常见的机器学习算法,用 TensorFlow 搭建深度学习模型,熟练使用 github 协同工作。
项目1:基于 CNN 图像识别,对煤层类别进行分类和检测
简介:学校与中国石油天然气集团公司(中石油),进行的校企合作项目。针对中国石油天然气集 团公司提供的测井曲线图片,设计分类和识别算法,并实现了结果展示系统,主要技术及实现,主要 使用 python 和 php 语言,主要技术包括:
1.1 对测井曲线图片进行相关特征的寻找和抽取
1.2 基于Tensorflow 搭建 CNN 网络,对图像分类
1.3 基于 SVM 进行图片分类
1.4 基于Thinkphp 和 D3.js 搭建识别结果展示平台
项目2:基于大数据的大型购物超市财务数据异常检测和预测
简介:作为数据分析师,基于 spark 集群设计了一套算法对步步高集团海量财务数据的异常进行检 测和数据分析,主要使用java 实现,主要技术包括:
2.1 基于 CHD5 的 Hadoop 生态圈大数据处理平台的熟练使用,包括常用的 spark、HDFS、Hive、 Hbase、sqoop;
2.2基于 Spark 实现一些大数据版本的数据挖掘和机器学习并行算法;
2.3能够高效实现 海量数据的处理,熟悉大数据处理的常用方法。
项目3 : 红网舆情监测系统
简介:我们为红网设计了一个爬虫,然后抽取了公共的评论,再通过‘jieba’进行中文分词,然后对 网民的情绪进行分类和统计,达到实时监测的结果,在爬去过程中我们通过最近邻方法对登录的验证 码进行了识别,模拟人工登录,最后做了一个展示平台。主要技术包括:
3.1基于 python 对中国红网所以网民评论进行爬取;
3.2基于‘jieba’实现了简单的分词 和情感统计;
3.3基于 Thinphp 和 echart 制作了简单结果展示平台
项目4: 华为杯第十五届研究生数学建模
简介:主要是基于 1998-2017 年的恐怖袭击事件进行数据挖掘 主要技术包括:层次分析法建模,建逻辑斯谛回归模型对经济损失进行预测并填充该指标中的 缺失值,最后通过简单Kmeas 聚类划分危险等级,LDA 主题模型进行文本相似度匹配等等。
项目6:网易杭研工作
简介:主要负责考拉海购的前端编码和实现。主要有一些前端的高并发和网易内部框架的学习。