• 熟悉Java、Scala开发语言、Shell脚本
• 熟悉Hadoop、Yarn、Spark、Flink等大数据处理框架
• 熟悉Hive、Hbase、Clickhouse等大数据存储库、熟悉Mysql
• 熟悉ElasticSearch、Kibana、了解Logstash、sqoop、flume
• 熟悉Kafka消息队列
• 熟悉Superset、Davinci BI工具
• 熟悉IDEA、Git等开发工具
• 通达信中台大数据平台基础建设
① 大数据平台整体架构部署
② 各类数据的采集、清洗、入库
• 通达信中台大数据平台BI可视化
① BI工具的部署、与各数据库集成
② 各类BI报表的制作
• 网站文书、法规实时流式清洗程序
① 参与整个数据存储、入库、出库全流程讨论,所用组件可行性调研
② 实时读取kafka数据并清洗、抽取各类业务所需字段并导入到mysql和es的程序开发、测试、上线
• 数据仓库的搭建和维护、各类主题数据的导入和维护
① 数据仓库的分层设计、按主题分类设计表结构
② 数据仓库的数据导入导出、数据的校验和维护
• elasticsearch搜索引擎的优化
① es搜索速度优化,通过优化硬件配置和参数配置提升搜索速度
② 通过测试不同风格的搜索语句、查询参数设置优化搜索精准度