电信大数据基础运营管理平台

基本信息

案例ID:213468

技术顾问:嗨皮撸 - 7年经验 - 南京亚信软件有限公司

联系沟通

微信扫码,建群沟通

项目名称:电信大数据基础运营管理平台

所属行业:企业服务 - 数据服务

->查看更多案例

案例介绍

项目描述:目前江苏电信集群已实现 hdfs、hbase、hive、yarn 等服务提供和组件管理,随着业务发展的需要和集群数量、规模的扩大,还会逐步提供 spark、storm、kafka 等服务能力。因此,一方面需要对监控的指标体系进行补充完善,实现 360 度掌控集群运营状况,对监控告警机制进行升级,实现监控告警更加及时、精确,方便集群异常问题和故障的定位、排查;另一方面需要增加spark、storm、kafka 等组件的监控管理能力,从而进一步完善江苏电信集群的服务提供能力和统一管理能力。
模块描述:
1.首页:升级原有统一首页,实现针对不同系统用户角色,内容差异化展示,核心内容包括集群 KPI 监控、
资源概览视图、待办阅办、告警信息等;
2.监控告警中心:一期项目建设已完成新 RTB 集群主机、组件(Hdfs、Yarn、Hive、Hbase)、业务的实
时监控,具备一般、重要、紧急三级告警机制;本项目建设,将持续优化数据采集和数据模型,保障数据质量和查
询效率,丰富监控、告警指标体系,新增对于 Spark、Storm 等组件的实时监控和告警,实现灵活配置管理;
3.运维中心:本项目建设,将大量依赖运维人员手动操作完成的工作,实现在系统中的可视化、流程化,提
供“一键式、自动化运维”,具体集成流程包括接口机部署、集群节点扩容、集群巡检、租户管理、队列管理;
4.故障信息中心:本项目建设,新建故障信息中心,帮助管理人员加强集群故障管理,实现集群故障处理的
信息留痕,构建“运维知识库”,提升处理同类问题和故障的效率 ;
5.运营分析中心:本项目建设,新建运营分析中心,将日常工作中需要的统计分析需求在系统中落地,定时
自动生成分析数据,自动给予优化与建议,并提供下载功能,具体统计分析需求包括组件监控分析(hdfs、yarn、
hbase)、集群巡检、主机监控分析(CPU/内存/IO/磁盘);
7.数据管理:重点对 hdfs 管理、hbase 管理、hive 管理功能进行优化,并新建 sparks 管理;
8.系统管理:一期项目建设已提供用户管理、用户组管理、角色管理、集群配置、客户端管理、日志管理等
功能;本项目建设,将重点优化日志管理功能;
9.大屏监控:一期项目建设已提供大屏监控功能;本项目建设,将增加新 RTB 集群大屏监控内容,并重点优
化用户体验。

相似案例推荐

其他人才的相似案例推荐

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服