ID:103096

康慨

数据并行化爬虫; 深度学习

  • 公司信息:
  • 百度
  • 工作经验:
  • 5年
  • 兼职日薪:
  • 700元/8小时
  • 兼职时间:
  • 可工作日远程
  • 所在区域:
  • 北京
  • 全区

技术能力

* 熟悉基本数据结构和算法,熟悉C++/Python/Java。
* 熟悉机器学习、数据挖掘、深度学习等基本原理与算法。
* 机器学习工具:熟悉numpy、pandas、scikit-learn、lightgbm、TensorFlow等。
* 网页爬虫:熟悉selenium、phantomjs、requests等爬虫库。

项目经验

钓鱼邮件的邮件内容、布局等与正常邮件极其相似,传统的机器学习方法的检测精确率和鲁棒性不是很理想。项目提出一种基于Word2Vec和卷积神经网络的深度学习分类方法。

– 数据预处理:对邮件样本进行过滤字符、中文分词、文档对齐等预处理,并训练得到word2vec特征向量。
– 训练卷积神经网络:构建由卷积层、最大池化层和全连接层组成的卷积神经网络,激活函数采用ELU,并采用dropout、 L2正则化以避免模型过拟合。
– 模型对比:增加两个分类效果较好的模型---基于高斯RBF核函数的支持向量机,以及随机森林模型。
– Docker分布式部署:用预装TensorFlow环境的docker镜像,创建多个container进行深度学习隔离训练。

评价列表

费斌杰    2017-07-02 23:14    5星

水平高超,办事靠谱!

费斌杰    2017-06-24 11:04    5星

很不错,合作两次了,很靠谱

费斌杰    2017-06-02 22:31    5星

水平很高,人很靠谱,好评!

信用行为

  • 接单
    5
  • 评价
    3
  • 收藏
    5
  • 五星率
    100%
  • 退款
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服