1、熟练掌握Java编程,熟悉SpringMVC,熟悉数据结构和基本的算法,熟练编写SQL语句,了解MongoDB;熟悉Linux环境下的项目开发和部署,会编写shell脚本。
2、熟练掌握Python编程,熟练使用Flask和Django;熟练使用numpy、pandas、matplotlib和Scikit-Learn等数据处理和机器学习库;熟悉TensorFlow、 Keras等框架以及运用;熟悉Neo4J数据库、Spark框架及Spark Mlib库。
3、掌握机器学习相关算法原理;熟悉SVD和PCA原理;熟悉K-Means等聚类算法,熟悉决策树、SVM、Random Forest和Boosting(AdaBoost、GBDT)等分类和回归算法应用原理;熟悉CNN、RNN和LSTM等神经网络模型和算法。
4、熟练使用nltk、jieba分词和HanLP等NLP库;熟悉自然语言处理的基本方法和模型,如贝叶斯模型、LDA和HMM;熟悉Word2vec基本原理和Attention机制,对深度学习运用于NLP也有较深刻理解;掌握知识图谱
一、工业知识图谱
项目介绍:富士康SMT产线上,有时会因为人为或者其他因素,其生产和组装机器会出现故障。此项目旨在根据静态知识(公开知识库、机台操作指南和网络资源)和动态知识(老师傅经验、后台数据库)搭建工业知识图谱;对机器故障的种类、程度和原因进行分析,并给出机器维护建议。
工作内容:
1、数据清洗处理及存储,收集csv文档并将其导入Neo4J数据库中。
2、使用Neo4J+Spark搭建工业知识图谱;使用HanLP处理问答语句的中文分词、自定义词典以及关键词匹配等;搭建基于Naive Bayes以及LSTM的基于机器故障的问答系统。
3、将初始模型封装成微服务API发布到Beacon云平台(富士康内部云平台)。
二、机器磨刀调参
项目介绍:生产工业刀具时,需要对刀具进行研磨以符合生产标准。传统的做法是经验丰富的老师傅调整各项磨刀参数;本项目致力于根据以往的机台参数以及刀具输出参数,搭建自动磨刀模型,以减轻磨刀工作和提升磨刀效率。
工作内容:
1、搭建磨刀simple model,把多输出回归问题转化为单输出的分类问题,使用SVM、
Random Forest和AdaBoost对其进行分类。
2、使用GBDT算法和LSTM搭建磨刀多输出回归模型,训练机台参数。
3、进入产线学习调研磨刀机器的实际工作原理和流程,实地参与模型调优,并将模型封装为微服务API。
三、高速 CNC 铣床刀具寿命预测
项目介绍:用于生产产品的工业刀具,在切割产品时会有一定程度的磨损。切割时由于受力大小、切割速度等因素的影响,刀具的最大切割次数(寿命)也不同;对于已使用的刀具,需要找出其剩余寿命的大小,为防止生产产品的不良率提升,需要对刀具进行及时的磨刀或者更换新刀具。
工作内容:
1、对已有的刀具磨损数据进行预处理,对刀具的受力和振动进行信号处理,如希尔伯特和
傅里叶变换,提取相应的信号特征值。
2、使用集成学习算法(AdaBoost、Random Forest和GBDT)和LSTM搭建刀具寿命和剩余寿命的回归模型;并协助将模型使用于实际的上产活动中。
四、员工考勤管理
项目介绍:为方便员工管理,根据员工的上下班打卡记录、进出厂区的刷脸记录和厂牌定位仪反馈的信号数据,识别其上下班时间以及在岗脱岗的行为分析
工作内容:
对已有的考勤打卡数据和anchor接收电子厂牌的信号数据,两种处理方法:
1、通过聚类的方法判断员工经常性的缺勤时间
2、通过分类的方式识别员工进出厂区
角色 | 职位 |
负责人 | 算法工程师/后台开发 |
队员 | 后端工程师 |