▲ 熟练掌握Python基础与面向对象编程方法
▲ 熟练掌握Python的进程、协程、线程等技术处理问题
▲ 熟练掌握Numpy、Pandas等模块,掌握Matplotlib可视化模块,了 解MATLAB,Echarts等可视化工具
▲ 熟练应用Scrapy框架,能够分析网站结构进行数据的爬取,可结合Redis 进行分布式爬虫搭建
▲ 熟练掌握无界面爬虫,对反爬策略有一定的掌握和代码实现
▲ 熟练运用MySQL,SQL server,MongoDb,了解Redis
▲ 熟悉机器学习K-means、K-NN、朴素贝叶斯、线性回归、逻辑回归等 无监督、监督算法
▲ 熟悉Django框架,了解Flask,Tornado,uWSGI、Nginx
▲ 熟悉HTML、CSS、JS、Jquery、HTML5、CSS3编程,了解VUE框架
▲ 熟悉Git版本管理工具,熟悉Gitlib的搭建
▲ 熟悉Linux操作系统,有Shell脚本编程能力
▲ 熟悉数据结构中的栈、队列、KMP、DFS、BFS、Prim、Boruvka、二 叉树、B树、Shell排序,二分查找等算法
▲ 熟悉Word,Excel,PowerPoint、Visio等常用的办公软件
▲ 掌握WeChat小程序、公众号的开发
▲ 了解神经网络,卷积神经网络的工作原理,了解常用的十二种卷积方式
▲ 了解Tenforflow、PaddlePaddle深度学习框架
项目名称:不同性别、年龄段献血人群血液成分占比导致疾病的分析预测(2019.01- 2019.04)
项目描述: 由于血库中的血液存在差异和变化,需要对不同年龄、性别的血液(A/B/AB/O型血)目标分类,
做到目标人群对应输血、目标血液调度准确,使用相关评判标准进行疾病的分析诊断,使得患者输血尽可
能的消除一些不必要的二次损害,比如不完全蛋白危害等等。将预测项目集成到产品中,更好地为产品做
分类的支持和功能服务。
项目流程: 1、使用pymysql连接MySQL数据库对其中的数据进行加载 2、筛选合理的特征值(血型,抗体特异性,白细胞数值,淋巴细胞数值等) 3、使用pandas以及numpy对数据进行过滤去除异常值以及量纲影响将数据不断按照机器学习算法 的分类,不断扩大支撑数据样本容量从而分类准确度 4、使用matplotlib等将结果展示给开发人员,开发人员将项目集成到产品中 项目职责: 1、参与业务需求文档的分析与整理,分析血液成分数据,确定优先使用的算法,敲定方案。 2、负责代码编写,使用pymysql从MySQL中拉取数据,筛选数据,pandas清洗数据,拆分数据、 使用训练数据、预测数据,优化训练集与测试集占比,得到最优准确率,绘制matplotlib图。 3、处理项目难点,在于熟悉特征值与目标值之间的联系。 4、集成到产品,与后端开发人员形成需要传出的API数据端口,与前端人员沟通形成可在项目前台展 示的图表信息。 5、合作书写数据分析报告