擅长Linux运维,熟悉Java、Python、Shell编程,掌握主流后端开发框架如SpringBoot、Flask
熟悉各类中间件的搭建维护和问题排查
熟悉虚拟化技术Vmware、KVM
掌握Kubernetes云原生的技术栈
1.服务故障、状态监控:主要是对服务器自身、上层应用、关联服务数据交互监控;例如针对前端web server,我们就可以有很多种类型的监控,包括应用端口状态监控,便于及时发现服务器或应用本身是否crash、通过icmp包探测服务器健康状态,更上层可能还包括应用各频道业务的监控,常用方法是采用面业特征码进行判断,或对重点页面进行签名,以网站被黑篡改(报警、并自动恢复被篡改数据)等等,这些只是一部份,还有N多监控方式,依应用特点而定,还有一些问题需解决,如集群过大,如何高性能的进行监控也是一个现实问题。
其它就是集群状态类的监控或统计,为我们合理管理调优集群提供数据参考、包括服务瓶颈、性能问题、异常流量等问题。
随着公司业务规模的不断扩大,必然会产生大量的日志,而且日志通常被分散在不同的设备上,如果采用传统的日志检索的方式,效率低下且繁琐,这使得日志定位分析变得困难,无法实时展示业务及服务器的运行情况。Elk提供了一套完整的日志搜集分析方案,通过elasticsearch提供一个强大的全
为了保持网站的正常运转,我们需要用zabbix进行监控,监控server的各种状态;主要包括故障监控和性能、流量、负载等状态监控,这些监控关系到集群的健康运行,及潜在问题的及时发现与干预; 1.服务故障、状态监控:主要是对服务器自身、上层应用、关联服务数据交互监控;例如针对前端