ID:135356

红色石头

资深算法工程师

  • 公司信息:
  • 汽车之家
  • 工作经验:
  • 3年
  • 兼职日薪:
  • 1000元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 所在区域:
  • 北京
  • 全区

技术能力

*掌握机器学习常用的算法如逻辑回归,神经网络,决
策树,随机森林,knn,svm,kmeans等以及深度学习,强化学习原理

*掌握对数据进行feature selection,combination等feature engineering的一般方法

*掌握常见数据结构和算法,用java,python 独立完成核心算法架构和实现

*掌握Oracle,MySql,Mongodb等数据库使用

*掌握使用hadoop,Spark相关技术,如map-reduce,hive、hbase等以及redis,kafka等

*掌握python常用的框架,并开发部署服务,框架比如Flask,Django等,web服务如tomcat,nginx等

*掌握多进程多线程编程,并利用的实际优化效率

项目经验

【项目一】
【项目名称】:用户信用模型评估系统
【项目描述】:通过App采集用户数据,包括性别,年龄,收入等,结合第三方数据获取用户的信息比如京东,淘宝,人行征信,社保卡等数据,建立机器学习模型,对用户信用进行评估,实现机器放款,提高放款效率,降低逾期率
【职责】:
>>特征工程:
行业专家提供一系列规则,编码抽取对模型可能有用的特征,合成样本,对样本进行Exploratory Data Analysis,对缺失数据,异常点数据进行处理,合成新的特征,用卡方检验,信息增益,相关系数等方法进行特征选择
>>模型选择:采用LR,svm,随机森林三种算法,用roc,auc,选出最优模型部署到生产环境中去
>>参数调优:
1.对模型参数进行交叉验证,绘制mse或mae图,选择最优参数
2.通过 Data Analysis,引入新的特征,检验其与标签的的相关系数
【项目二】
2.短文本挖掘:短信分类
>>模型建立:对用户短信进行分字,去掉停止词,把文本转换成tf-idf词向量形式,出现不均衡数据集的情况,用Bootstrapping算法对样本进行重抽样,用nbc,svm,决策树算法进行训练.
vvvvv>>模型调优:
1.画出词云,对词频最高的词,字进行观察
2.对分类不准确的样本分词后进行Data Analysis,人工引入一些规则
3.用网格搜索来进行高效的参数调优
4.CRM统计报表:用户数据统计
>>用Es+kabana建立CRM数据统计报表,为上层业务决策提供数据支持

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    1
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服