1: LINUX内核死机定位: OOM、空指针、地址错误、死锁(D死锁、线程AA死锁、CPU AA死锁、线程ABBA死锁、CPU ABBA死锁)、NMI watchdog多个故障模式的定位方法。
2: LINUX性能优化: 掌握性能瓶颈检测方法、性能监控工具、不同层次的性能优化分析方法(架构、模块、代码),性能优化手段(缩短业务路径、资源置换、零拷贝、无锁)。
3: LINUX驱动开发: 熟悉字符设备、PCI设备驱动开发和调试
4: LINUX系统问题: 熟练运用linux工具调试linux用户态死机、linux服务异常、linux功能异常问题
1: Kbox: 利用内核工具kprobe和各种重启notifier hook,设计并开发专门定位LINUX系统重启(应用层导致、内核层导致、硬件MCE导致、系统看门狗等各种原因导致LINUX系统重启)的内核模块定位工具KBOX, 目前该工具被移植到华为自研欧拉OS作为系统标准组件, 并且同时支持物理机和VM场景下的OS定位。
3: 内核死机定位手册: 总结内核死机故障模式:OOM、空指针、地址错误、死锁(D死锁、线程AA死锁、CPU AA死锁、线程ABBA死锁、CPU ABBA死锁)、NMI watchdog多个故障模式的定位方法。
4: 解决维护问题:Linux OS问题近千个(包括用户态和内核态问题),并以JIRA跟踪系统记录定位过程,便于分析重点问题来源和后续工作重点,持续提升工作效率和工作效果。
5:总结OS维护定位手册:总结OS类问题故障模式(重启问题、文件系统问题、死机问题、OS命令使用异常问题、OS服务异常问题)和相应的解决方法。
6:KVM&QEMU虚拟化热迁移: VM热迁移技术研究中达成了基于同样业务时KVM热迁移性能指标(总时间和停机时间)与VMware持平目标。
7:KVM &QEMU虚拟化业务可靠性: 及时检测VM文件系统故障,通过文件系统故障隔离,保证业务继续; VM KBOX和HOST KBOX分别监控VM和宿主机的异常重启,1秒通知HA倒换业务。
8: 虚拟化OS部署: 开发和维护核心网传统一体机场景和NFV虚拟化场景的自动部署工具,方便进行大规模自动部署。