熟悉 python 语言, 拥有较优的编码风格
熟悉 Tableau 数据分析工具, 并编写分析报告
熟悉 MYSQL 数据库
拥有使用 SQL 语言进行复杂业务处理的经验
熟练使用 Python 库(Numpy, Pandas, Matplotlib, Pyecharts) 处理数据
掌握机器学习算法 (K-means 聚类算法,决策树算法, xgboost等) 掌握常用算法 (动态规划, 贪婪, 图等)
熟悉相应的反爬策略及应对措施, 并掌握 scrapy 爬虫框架
熟悉 HTML5 语言/CSS3, 以及熟练使用 git 操作项目
能够使用Django框架开发产品
项 目: 公司内部数据统计报表
技术架构: requests + numpy + pandas + mysql + xlwt + pyecharts + Flask
功能描述:在了解公司业务的前提下,对接公司内部接口,对销售,媒介,渠道,项目维度划分,并进行相应指标的统计,并利用开发框架形成统计图形和报表的展示
项目名称(自主练习): 机器学习-人民币识别
技术架构: os + cv2 + torch + PIL + torchvision
功能描述:人民币图像数据归一化处理, 利用面向对象和 Image 库把彩色图像转换为三通 道数据, 构建图像的目标值, 获取 VGG16 卷积神经网络, 并用 DataLoader 类构建装载器, 装载器中迭代获取特征数据并输入网络, 正向传播, 反向传播, SGD 随机梯度下降优化算法 (优化器)更新梯度的方法来优化模型, 利用模型加载网络, 输入特征数据进行预测分类