获CDA一级数据分析、CDA二级数据建模认证。熟悉主流机器学习模型原理,具备建模调优能力。熟悉hadoop架构以及hive、hbase、spark等大数据组件的使用和配置。能熟练运用Python、Scala、Java等编程语言以及hive、MySQL、Pandas、帆软、power BI等数字化工具。掌握基础网络、Linux、容器知识。企业数字化转型团队负责人。主要负责的工作有人工智能技术在运维工作中的应用、大数据开发、数据分析建模、自动化运维、自动化办公工具的开发;企业人员数字化转型相关技术的培训。
基于神经网络模型的垃圾短信智能识别
项目目标:自动识别垃圾短信,并提取高频关键词实现自动拦截。
我的工作:中文分词、文本向量化、构建训练和测试数据集,gridsearch参数调优和K折交叉验证模型评估,MLP神经网络模型搭建。
结果:垃圾短信智能识别准确率达到93%。大幅减轻人工劳动强度。
移动网码号资源管理系统
项目目标:开发本地管理系统,管理各运营商的IMSI、H、MDN码资源。
负责工作:数据自动解析入库模块开发、数据自定义查询和可视化模块开发。
结果:基于Python和MySQL可实现各类文件类型数据自动解析入库,基于帆软开发web数据可视化面板,可实现数据自定义查询、导入导出、填报修改等功能。
本工具基于Python开发,利用二分查找算法可以快速实现批量IP地址段的去重合并,可用于网络运维工作中的IP数据清洗。
基于Python开发自动化工具,实现将运营商系统提取的非格式化数据自动解析、格式化、字段关联,并自动计算和提取关键指标。