1、熟练使用Scala、Java等开发语言
2、熟练Linux操作命令,能编写常用shell脚本
3、熟练使用内存计算引擎Spark(SparkCore、SparkSQL、SparkingStreaming)
4、熟练使用大数据生态圈(HDFS、Hive、Mapreduce、Sqoop、Flume、Kafka、Oozie、Hue等)
5、熟练运用MySQL等关系型数据库
6、熟悉运用HBase等非关系型数据库
1、联通网优平台,nps模块:通过对用户静态属性、账单详情和网络指标的分析,使用基于神经网络的分类算法,通过对用户信息特征编码,对用户指标特征的归一化后输入神经网络模型进行训练,自动识别网络中贬损概率较高的用户,剖析NPS贬损的透视分析。结合用户属性,多维度呈现NPS分布情况。结合位置信息聚焦场景/微网格,地理化聚类贬损集中区域,与场景/微网格MR评估结果关联。
2、赫利乌兹平台