1. 掌握大数据生态圈比如hadoop, spark, hive, hbase等相关知识
2. 掌握图数据库的用法和性能调优,组织过节点超2亿,关系超5亿的只是图谱
3. 熟悉python数据分析建模,涉及舆情分析,问答系统,金融评分建模等领域
4. 开发语言java, python
5. 分布式爬虫
1. 人工智能在线系统,把机器学习各个组件封装成组件的形式,建立一个类似阿里云MaxCompute的一套线上学习系统
2. 建立基于金融领域的一个知识图谱反欺诈系统
3. 建立基于电商购物的一个智能问答系统
4. 建立基于银行反欺诈反套利的一套知识图谱反欺诈系统