ID:196165

JC

数据挖掘工程师

  • 公司信息:
  • 精益有容(北京)科技有限公司
  • 工作经验:
  • 3年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 所在区域:
  • 北京
  • 海淀

技术能力

1、熟练使用python数据科学生态包numpy、pandas、sklearn、matplotlib、seaborn等开展数据处理、数据转换、数据挖掘等相关数据工作,熟悉数据分析、数据挖掘基本思路与方法。熟练使用time、collections、datetime、os等内建模块。日常使用jupyter notebook工作。
2、熟悉并熟练使用常用数据挖掘算法:决策树、SVM、逻辑回归、神经网络、聚类等,熟悉其原理及常用参数调配,拥有实际数据挖掘项目经验
3、熟练使用request、selenium、正则、bs4进行数据爬虫
4、熟练使用SPSS modeler挖掘工具
5、熟悉基于tensorflow、keras的深度学习相关知识,并具有深度网络进行图片分类与识别的项目经验
6、熟悉python编程

项目经验

深度学习图片文字分类识别(2019/08–2019/12)
项目职务:数据挖掘工程师
项目描述:实现汉字识别的功能,并接入到公司的APP,对用户上传的图片进行汉字识别,得到图片中的具体汉字是什么。同时,计算得到用户上传图片与模板图片的相似度。通过添加人工智能技术,增加App的科技性、趣味性,提高用户对App是使用粘性。
项目职责:
1)数据集制作:通过python对现有的图片数据集进行分类、贴标签、划分训练集验证集合。同时,爬取一些更真实场景的用户数据,添加到数据集中。
2)数据增强:对数据集进行剪切、旋转、模糊等处理,实现数据增强
3)利用tensorflow框架,复现ResNet卷积神经网络模型,设置batchsize、lr等参数,在linux GPU下开展模型训练,并不断调优提高模型的验证准确率。最终的模型的分类准确在96%。
4)安装tensorflow serving,实现模型服务。将模型转化为serving格式,提交给tensorflow serving实现生产环境的实时服务。
5)模型部署到tensorflow serving,设定分类预测评分阈值,实现对用户上传图片过滤及预测
6)模型迭代,使用不断积累的用户数据迭代训练模型提高模型性能。
项目业绩:训练的模型准确率达到96%识别准确率;成功部署到线上,实现生产环境实时图片识别分类服务。

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服