项目描述:
1. 原项目平台使用Hubble做在线交易和大规模数据的即席分析的场景,因行方业务数据量迅猛增长,目前该平台已不能支撑业务正常运作及故障率暴增.
2. 现平台更换架构方案 采用 hbase+elasticsearch做二级索引,提供海量历史,实时交易数据查询 ,平台es 索引数据 50w/s, 提供各业务部门并发访问查询每秒1000,平均响应时间0.5s
项目职责:
1. 部署构建cdp平台,主要组件 hdfs,yarn,hive,hbase及kerberos安全认证.节点数20个
2. 部署es集群环境 5master + 10data 冷热分离节点, 以及安全认证
3. 数据量80亿流水表 批量写入hbase,es 优化写入性能
4. es索引分片数据大小规划,索引命名设计, hbase的rowkey 与es的id设计对应关系